ענקית הטכנולוגיה מטא (Meta) מבקשת מבית משפט מחוזי בארה"ב לבטל תביעת ענק שהוגשה נגדה, בטענה כי החברה הורידה באופן בלתי חוקי תכני פורנוגרפיה באמצעות פרוטוקול ביטורנט (BitTorrent) במטרה לאמן את מודלי הבינה המלאכותית (AI) שלה, כולל ה-Movie Gen. 
התביעה, שעלולה להגיע לנזקים של למעלה מ-350 מיליון דולר (כ-1.3 מיליארד שקל), מציפה שוב את סוגיית הקניין הרוחני ושימוש בלתי מורשה במאגרי מידע ענקיים לאימון מודלי AI גנרטיביים על ידי חברות ענק.
מטא לא נשארה חייבת
התביעה, שהוגשה על ידי חברת Strike 3 Holdings המפיקה סרטי מבוגרים, טוענת כי החברה גילתה הורדות פיראטיות של כ-2,400 מכותריה במשך תקופה של שבע שנים החל מ-2018, דרך כתובות IP ארגוניות של מטא, וכן באמצעות "רשת נסתרת" לכאורה שכללה כ-2,500 כתובות IP נוספות. 
מטא, בצעד נגדי, הגישה לבית המשפט בקשה רשמית לדחיית התביעה, בטענה כי החברה התובעת מסתמכת על "ניחושים ורמיזות". מטא אף הגדילה וטענה כי Strike 3 Holdings "כבר סומנה בעבר על ידי חברות אחרות ככזו המגישה תביעות לשם סחיטה".
מטא, בצעד נגדי, הגישה לבית המשפט בקשה רשמית לדחיית התביעה, בטענה כי החברה התובעת מסתמכת על "ניחושים ורמיזות"
לפי הטיעון של מטא, אין כל הוכחה לכך שהחברה עצמה הורתה על ההורדות או הייתה מודעת לפעילות בלתי חוקית שכזו. עוד נטען כי Strike 3 לא סיפקה כל עובדה המצביעה על כך שמטא אימנה מודל AI על תכנים כאלה, ובטח שלא באופן מכוון. דובר מטא הגדיר את הטענות כ"מגוחכות".
אחד הטיעונים המרכזיים של מטא נשען על פערים כרונולוגיים והיקף ההורדות. ההורדות המדוברות החלו כבר ב-2018, כארבע שנים לפני שמאמצי מטא במחקר מודלי וידאו גנרטיביים החלו באופן רשמי. לטענת מטא, קשה להסיק שההורדות נועדו לאימון AI. בנוסף, תנאי השימוש של מטא אוסרים על יצירת תוכן למבוגרים, מה שמנוגד להנחה שתכנים כאלה יהיו שימושיים לאימון המודלים שלה.
מטא מציגה נתון של כ-22 הורדות בשנה בממוצע דרך כתובות ה-IP הארגוניות שלה, במשך שבע שנים. זהו נתון נמוך משמעותית, לטענתה, מ"מאמץ מרוכז לאיסוף מאגרי המידע העצומים הנדרשים לאימון יעיל של AI", וסביר יותר שמדובר ב"שימוש אישי פרטי" על ידי עובדים, קבלנים או אורחים מזדמנים שניצלו את הרשת של החברה.
ההתנגשות בין זכויות יוצרים ואימון AI
המקרה הנוכחי הוא חלק מגל תביעות נגד חברות טכנולוגיה גדולות ברחבי העולם, המאמן את מודלי ה-AI שלו על מאגרי נתונים הכוללים יצירות המוגנות בזכויות יוצרים. בניגוד לתביעות שהוגשו על ידי סופרים ומחברי ספרים בארה"ב נגד מטא וחברות דומות, בהן נטען כי יצירותיהם נכללו במאגרי נתונים ענקיים של מיליארדי "אסימונים" לאימון מודלי שפה גדולים (LLMs) דוגמת LLaMA, התביעה של Strike 3 מתמקדת בהורדות ביטורנט ספציפיות.
באירופה, המחוקקים מתקדמים עם חוק ה-AI, המבקש להסדיר את שוק הבינה המלאכותית, כולל דרישות שקיפות סביב נתוני האימון. אולם, ההתנגשות בין זכויות יוצרים ואימון AI היא סוגיה גלובלית מורכבת שטרם הוכרעה משפטית באופן גורף. 
ההימור של מטא בדחיית התביעה אינו נוגע רק להימנעות מתשלום הנזקים. הוא מהווה גם הגנה אסטרטגית על המחויבות המוצהרת של החברה למנוע ממודלי הווידאו שלה לייצר תכנים מיניים מפורשים, תחום הנמצא בפיקוח הולך וגובר. 
"אנחנו לא רוצים תוכן כזה, ואנחנו נוקטים בצעדים מכוונים כדי להימנע מאימון על חומרים מסוג זה", ציין דובר מטא. בית המשפט נתן ל-Strike 3 Holdings שבועיים להגיש תגובה לבקשת הדחייה של מטא, והמשך הפרשה צפוי להיות אחד ממוקדי העניין המרכזיים בקרב קהילת הטכנולוגיה והקניין הרוחני.








