מסמך פנימי ומסווג של חברת מטא, שנחשף על ידי סוכנות "רויטרס", חושף מדיניות מפתיעה ומדאיגה בכל הנוגע להתנהגות צ'אטבוטים מבוססי בינה מלאכותית של ענקית המדיה החברתית. על פי המסמך, לבוטים של החברה הותר "לנהל שיחות רומנטיות או חושניות עם ילדים", לייצר מידע רפואי כוזב, ואף לסייע למשתמשים לטעון שאנשים ממוצא אפרו-אמריקאי "טיפשים יותר מאנשים ממוצא לבן".
כאמור הפרטים המזעזעים הללו נחשפו על ידי רויטרס לפני כמה ימים, לאחר שהסוכנות ערכה סקירה מקיפה של המידע שהגיע לידיה. המסמך, שנקרא "GenAI: Content Risk Standards", דן בסטנדרטים המנחים את העוזרת האישית של מטא - Meta AI, וכן את הצ'אטבוטים הזמינים בפלטפורמות שלה: פייסבוק, וואטסאפ ואינסטגרם.
ילדים אטרקטיביים
המסמך המסווג, בן יותר מ-200 עמודים, אושר על ידי צוותים בכירים במטא, לרבות הצוות המשפטי, צוות המדיניות הציבורית והמהנדס הראשי, מה שמדגיש את המודעות של הדרג הבכיר לתכניו הבעייתיים.
אחד הממצאים המטרידים ביותר הוא ההיתר שניתן לבוטים "לתאר ילד במונחים המעידים על האטרקטיביות שלו". לדוגמה, המסמך מציין כי זה בסדר שבוט יאמר לילד בן שמונה ללא חולצה כי "כל סנטימטר שלך הוא יצירת מופת – אוצר שאני מוקיר עמוקות". עם זאת, יש גבול: הסטנדרטים קובעים כי "לא מקובל לתאר ילד מתחת לגיל 13 במונחים המצביעים על כך שהוא רצוי מבחינה מינית".
לפי המסמך המסווג, זה בסדר שבוט יאמר לילד בן שמונה ללא חולצה כי "כל סנטימטר שלך הוא יצירת מופת – אוצר שאני מוקיר עמוקות"
בעקבות פניית רויטרס, דובר מטא, אנדי סטון, אישר את אמינות המסמך, אך הודיע כי החברה כבר הסירה חלקים ממנו המאפשרים לבוטים לפלרטט ולהשתתף במשחקי תפקידים רומנטיים עם ילדים. סטון הודה שהדוגמאות הללו היו "שגויות ואינן עולות בקנה אחד עם המדיניות שלנו" והוסיף כי לחברה יש "מדיניות ברורה האוסרת תוכן שמציג ילדים בצורה מינית ומשחקי תפקידים מיניים בין מבוגרים לקטינים".
עוד נמסר ממטא: ״יש לנו מדיניות ברורה לגבי סוגי התגובות שדמויות בינה מלאכותית יכולות לספק, והמדיניות הזו אוסרת על תוכן מיני של ילדים ועל משחקי תפקידים מיניים בין מבוגרים לקטינים. מעבר למדיניות עצמה, יש מאות דוגמאות, הערות והסברים המשקפים התמודדות של הצוותים עם תרחישים היפותטיים שונים. הדוגמאות וההערות המדוברות היו ונותרו שגויות. הו אינן תואמות את המדיניות שלנו, ולכן הוסרו״.
גזענות ותוכן שקרי
המדיניות של מטא נראית ליברלית באופן מפתיע גם בתחומים רגישים אחרים. בעוד שהתקנים אוסרים על שימוש ב"דברי שטנה", קיימת "החרגה המאפשרת לבוט ליצור אמירות המשפילות אנשים על בסיס המאפיינים הבסיסיים שלהם" - כלומר על פי מאפיינים מולדים כמו גזע. על פי כללים אלו, כך נכתב במסמך, הבינה המלאכותית של מטא יכולה "לכתוב פסקה הטוענת כי אנשים שחורים טיפשים יותר מאנשים לבנים". מטא סירבה להגיב על דוגמה זו.
נוסף על כך, המסמך מאפשר לבינה המלאכותית לייצר תוכן שקרי, ובלבד שתתווסף לו הבהרה מפורשת שהוא אינו אמיתי. כך, לדוגמה, ייתכן מצב שבוט יפיק מאמר שקרי שטוען כי בן מלוכה בריטי מסוים סובל ממחלת מין, כל עוד המאמר ילווה בהערה שהמידע אינו נכון. סוג של הסרת אחריות שכזאת.
המסמך מתייחס גם ליצירת תמונות, במיוחד של אישי ציבור. למשל לבקשה "טיילור סוויפט חשופת חזה", המסמך מציין כי התשובה המקובלת היא "לסרב לבקשת המשתמש ולייצר במקום זאת תמונה של טיילור סוויפט מחזיקה דג ענק".
עם זאת ידוע כי אפשרי בהחלט לעקוף הגנות מעין אלה על ידי מניפולציות של פרומפטים, כך שלא ברור עד כמה יעילה ההגנה שמהנדסי מטא הוסיפו שם. בכל מקרה, כנראה יותר קשה להסתבך עם עורכי הדין של סוויפט מאשר עם אלו של פדופיל, כי אחרת לא ברור למה הזמרת זוכה להגנה שילד בן 8 לא זוכה לה לפי ההנחיות של המסמך.
לדבריה של אוולין דואק, פרופסור באוניברסיטת סטנפורד המתמחה ברגולציה של חברות טכנולוגיה, המסמך "מדגיש שאלות משפטיות ואתיות בלתי פתורות בכל הנוגע לבינה מלאכותית וצ'אטבוטים". היא הוסיפה כי "משפטית עדיין אין לנו את כל התשובות, אבל מוסרית, אתית וטכנית, זו כבר שאלה שונה לחלוטין".