איך שיר נולד? גונבים אותו

קטגוריות: , ,

ז'אנר מערכות הבינה המלאכותית היוצרות, הגנרטיביות, הגיע לעולם כשהוא ממוקד בטקסט. טקסט הוא הדבר הקל ביותר לעיכול, ניתוח והבנה על ידי אלגוריתמים ולכן זה לא מפתיע שהמוצר הראשון והמרשים באמת בז'אנר היה מערכת מבוססת־שיחה, ChatGPT.

אבל לאחרונה המערכות הגנרטיביות מתחילות להשתלט גם על תוכני מדיה עשירים: תמונה, וידאו וסאונד. כדי לייצר תכנים מהסוג הזה יש צורך לא רק במשאבי מחשוב אדירים, אלא גם באלגוריתמים מתוחכמים שמסוגלים לחקות תנועת מצלמה ופרספקטיבה או בכאלו שיש להם הבנה עמוקה של מלודיות, של סולמות מוזיקליים והרמוניה.

כדי להשיג את אותה "הבנה עמוקה" (ביטוי מעט מתעתע שלא ברור מה באמת עומד מאחוריו) הזינו לתוך המערכות האלו עשרות ואף מאות מיליוני שירים, נעימות ומנגינות, ואז האלגוריתמים שלהן זיהו תבניות שחוזרות על עצמן, ומייצרות את אותה הרמוניה מוזיקלית.

נשמע נהדר, אבל איפה נמצא עשרות מיליוני שירים? ובכן, על פי ההערכות יש בעולם בין 80 ל־230 מיליון שירים מוקלטים. משום כך, כל שצריך לעשות הוא להזין אותם לתוך המערכות האלו – כפי שהזינו, למשל, את ויקיפדיה לתוך ChatGPT – ואז המכונה תעשה את מה שהיא עושה והרי לכם שירותים כמו Suno או Udio שמאפשרים למשתמשים להקליד הנחיות (Prompts) לשיר או מנגינה וכעבור כמה שניות – בום! שיר נולד.

העניין הוא שוויקיפדיה היא פרויקט חופשי, פתוח, שאפשר להשתמש בטקסט שמופיע בו מבלי לבקש אישור. שירים, לעומת זאת, מוגנים על פי חוקי זכויות היוצרים.

זאת ועוד, לפי בדיקה שערך איגוד תעשיית ההקלטות האמריקאי, ה־RIAA, שני השירותים האלו פולטים חתיכות שלמות של שירים שמוגנים על פי חוקי זכויות היוצרים. כלומר, לא רק שהחברות שעומדות מאחוריהם לא שילמו עבור הזכות להשתמש בשירים המוגנים כתוכן שבאמצעותו הן אימנו את המודלים שלהן, הן פיתחו שירותים שלא מייצרים שירים חדשים בכלל, ולא, אין זו "השראה" – אלו מערכות שלעיתים פולטות את השירים המקוריים, כמעט אחד לאחד.

הדבר דומה לשירות גנרטיבי שיציע למשתמשים צילום מקורי של אנני ליבוביץ', שירות אחר שינפק ציטוטים מלאים מתוך ספרים של ג'ון גרישם, ושירות שלישי שיפיק קליפים מתוך סרטי הקולנוע של סטיבן ספילברג; זו לא "השראה". זו סתם גניבה – וזו בדיוק הטענה של איגוד ה־RIAA שהגיש לאחרונה תביעה נגד Suno ו־Udio.

צריך להדגיש שלמרות מה שנטען בכתב התביעה, קשה לדעת אם זה מה שהן עשו. מאז שהוגשו תביעות נגד חברות שמפתחות שירותים שמייצרים טקסטים ותמונות, בטענה שהן השתמשו בתכנים המוגנים על פי חוקי זכויות היוצרים, החברות בתחום מסרבות לחשוף כיצד הן מאמנות את המודלים שלהם, אם כי, בואו נודה על האמת, אין זו תעלומה. אין דרך לאמן מודלים מוזיקליים בלי הרבה מאוד מוזיקה; וחלק עצום מהמוזיקה, בוודאי מוזיקה פופולרית, מוגן בהגנת זכויות היוצרים, מה שאומר שאי אפשר לקחת אותה ולעשות בה כרצוננו, שלא לדבר על לקחת אותה ואז להפיק אותה מחדש בהסוואה של "יצירה חדשה של מערכת בינה מלאכותית".

אם ה־RIAA תצליח להוכיח שזה מה שקרה, עשוי בית המשפט לפסוק שיש לסגור את שתי החברות. פסיקה מהסוג הזה תשלח גלי הלם בקרב שאר החברות שמפתחות מודלים גנרטיביים ושנמצאות במרדף בלתי פוסק אחר עוד תוכן, עוד טקסט, תמונה או שיר שבהם אפשר להאביס את המכונות שלהן כדי שהן יהיו מוצלחות, מהירות, יעילות ואמינות יותר.

נדמה שאין זה מקרה שזמן קצר לאחר פרסום הידיעה על התביעה, פורסמה ידיעה נוספת לפיה יוטיוב מבקשת לחתום על עסקת רישוי עם חברות התקליטים הגדולות בעולם, דוגמת "סוני", "וורנר" ו"יוניברסל", כדי שהיא תוכל לאמן את מודל הבינה המלאכותית שלה שאותו היא מתכננת להשיק לקראת סוף השנה. המודל שלה ידע לייצר…. שירים!

ליוטיוב אין בעיית מזומנים כפי שיש לחברות סטארטאפ בראשית דרכן – היא חברה־בת של אלפאבית – אבל גם היא נתקלת בהתנגדות. על אף שחברות התקליטים מחזיקות בזכויות היוצרים של השירים שנוצרו על ידי האמנים שלהן, הן יודעות שהן הולכות על הגבול הדק שבין "להיות בקדמת הטכנולוגיה" ל"לכרות את הענף שעליו אנחנו יושבות".

כשיוטיוב פנתה ישירות לאמנים כחלק מפרויקט ניסיוני, רק עשרה השיבו בחיוב; ללמדנו שגם האמנים שואלים את עצמם כיצד להגיב לחיבוק החם והמפתה של חברות הטכנולוגיה. הם יודעים שלעיתים זה נגמר בבכי.

האם אנחנו חוזרים לימי נאפסטר העליזים (או העצובים, תלוי את מי שואלים)? האם מה שאנחנו רואים הוא תעשייה שמרנית ומאובנת שלא מבינה שהטכנולוגיה מתקדמת והגיע הזמן להתקדם יחד איתה, או שמא מה שקורה כאן הוא בכלל לא קדמה, אלא תליין שמגיש לתלוי את החבל כשהוא מחייך אליו בצער והבנה?

(מגזין TheMarker, פורסם ב-19.8.2024)

תגובות

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *