"פגיעה קשה בפרטיות": האם OpenAI תיאלץ לחשוף עשרות מיליוני צ’אטים של משתמשים?

מפתחת ChatGPT מבקשת לבטל צו שמחייב אותה למסור לבית המשפט עשרות מיליוני צ’אטים אנונימיים של משתמשים. הניו-יורק טיימס דורש את השיחות כראיה לכך שהחברה השתמשה בתכנים מוגנים של העיתון והפרה זכויות יוצרים. הקרב המשפטי בין השתיים מגיע לנקודת רתיחה

רפאל קאהאן|

תגיות

חברת OpenAI, מפתחת ChatGPT, פנתה לבית המשפט הפדרלי בניו יורק בדרישה לבטל צו המחייב אותה למסור מיליוני יומני שיחות (צ'אטים) של משתמשי הפלטפורמה (אם כי באופן אנונימי) לידי "הניו יורק טיימס" וגופי חדשות נוספים, במסגרת תביעת ענק נגדה על הפרת זכויות יוצרים.
גלריה
ניו יורק טיימס ו-ChatGPT
(עיבוד תמונה. צילום: shutterstock)
"הפרה בוטה של פרטיות המשתמשים"
לטענת OpenAI, חשיפת 20 מיליון הצ'אטים המדוברים, אפילו אם יהיו מנוטרלים מפרטים מזהים, תהווה "הפרה בוטה" של פרטיות המשתמשים ותאפשר ל"טיימס" "מסע דיג ספקולטיבי" בשיחות אישיות. 
החברה טוענת כי 99.99% מהתוכן ביומנים אינו רלוונטי לטענות הפרת זכויות היוצרים. ראש אבטחת המידע של החברה אף הזהיר כי מסירת הנתונים עלולה להוביל לחשיפת "עשרות מיליוני שיחות אישיות ביותר" של אנשים שאינם קשורים כלל לתביעה.
מנגד, דובר ה"ניו יורק טיימס" דחה את הטענות וטען כי OpenAI "מטעה במכוון את משתמשיה". לדבריו, בית המשפט הורה על מסירת מדגם אנונימי של שיחות תחת צו הגנה משפטי מחמיר, ופרטיות המשתמשים אינה בסכנה. 
דובר ה"ניו יורק טיימס" טען כי OpenAI "מטעה במכוון את משתמשיה" וכי פרטיותם לא נמצאת בסכנה
ה"טיימס" דורש את היומנים כראיה מכרעת כדי לבסס את טענתו כי ChatGPT שכפל את התוכן המוגן של העיתון, וכדי לסתור את טענת OpenAI כי העיתון עצמו "פרץ" למודל כדי לייצר ראיות מפוברקות. המועד האחרון למסירת הנתונים הוא יום שישי הקרוב (מחר).
יוצרי תוכן נגד חברות ה-AI
הסכסוך הנוכחי הוא שיא נוסף בתביעה שהגיש ה"טיימס" נגד OpenAI ושותפתה מיקרוסופט. התביעה טוענת כי החברות השתמשו במיליוני מאמרים של העיתון, שעלות יצירתם נאמדת במיליארדי דולרים, כדי לאמן את מודלי הבינה המלאכותית שלהן ללא רישיון או פיצוי, ובכך "רכבו בחינם" על חשבון עבודתם העיתונאית. 
ה"טיימס" תובע פיצויים של מיליארדי דולרים ודורש מבית המשפט להורות על השמדת מודלי ה-GPT שאומנו על תכניו. מקרה זה מייצג את אחת התביעות המרכזיות בשורה של עימותים משפטיים בין חברות טכנולוגיה ליוצרי תוכן, בהם סופרים (כמו ג'ונתן פרנזן וג'ורג' ר.ר. מרטין) ואמנים, הטוענים כי הבינה המלאכותית פועלת ככלי פיראטי.
מנכ"ל OpenAI, סם אלטמן
(רויטרס)
המאבק בבית המשפט האמריקאי מתנהל על רקע מציאות משפטית מפוצלת בעולם. באירופה, נרשם השבוע ניצחון משמעותי ליוצרים: בית משפט גרמני פסק לטובת GEMA (האגודה הגרמנית לזכויות מלחינים ומוזיקאים), וקבע כי ChatGPT הפר זכויות יוצרים כשהשתמש והפיק מילים משירים גרמניים מוגנים ללא רשות. האגודה הגרמנית הגדירה זאת כ"פסיקה תקדימית ופורצת דרך באירופה", המצביעה על גישה מחמירה יותר כלפי שימוש בחומרים מוגנים לצורך אימון מודלים.
בארה"ב, המצב מורכב יותר: בעוד ה"טיימס" ויוצרים רבים אחרים נאבקים ללא פשרות, פסיקות קודמות יצרו סדקים בחזית. בתביעה אחרת (נגד אנת'רופיק, מפתחת המודל "קלוד"), קבע שופט פדרלי כי אימון מודלי בינה מלאכותית על ספרים מוגני זכויות יוצרים יכול להיחשב "שימוש הוגן" – טיעון מרכזי עליו מתבססות חברות הטכנולוגיה. פסיקה זו יצרה תקדים המעדיף את חברות הטק, תוך הפרדה חדה בין האימון לבין שימוש בנתונים שהושגו באופן לא חוקי (כגון מאתרים פיראטיים).
הניגוד בין הפסיקה הגרמנית החד-משמעית לבין הפיצול המשפטי בארה"ב, המאפשר לחברות AI מרחב תמרון תחת עקרון "השימוש ההוגן", מדגיש את הצורך הדחוף בהסדרת הרגולציה סביב טכנולוגיית ה-LLM. 
בתוך חוסר הוודאות הזו, חברות הטכנולוגיה מחפשות פתרונות: מיקרוסופט, למשל, כבר הודיעה כי היא תישא בעלויות משפטיות ותגן על לקוחותיה העסקיים אם ייתבעו על הפרת זכויות יוצרים, מהלך הממחיש את גודל הסיכון המשפטי שהתעשייה כולה ניצבת בפניו. 

פנייה לכתב/ת

מצאתם טעות? כתבו לנו | המייל האדום גם בווטסאפ

תגובות