סומכים על דיפסיק? אולי כדאי שתחשבו על זה שוב פעם. מאז שפרץ המודל הסיני לפני כחודש לתודעת הציבור, הוא לא הפסיק לעורר דיונים ושמועות על יכולותיו, וגם על מגבלותיו, מחיר הפיתוח שלו וכמובן איך אפשר שלא, על המעורבות של הממשלה הסינית בניהולו.
5 צפייה בגלריה
דיפסיק - החברה הסינית שמטלטלת את עולם ה-AI
דיפסיק - החברה הסינית שמטלטלת את עולם ה-AI
דיפסיק - המודל הסיני שמטלטלת את עולם ה-AI
(shutterstock)
"זה לא מוגזם להגיד שדיפסיק שינה את העולם. צריך להוריד בפניו את הכובע", אומר ל-ynet גדי עברון, מנכ"ל ומייסד חברת הסייבר לבינה מלאכותית Knostic. "זה מודל פשוט שכל אחד יכול להריץ בבית על מחשב. אבל הוא גם כפוף לצנזורה וצריך להבין את זה".

בין דיפלומטיה זהירה לעיקרון "סין האחת"

צנזורה - מילה טעונה בעולם הסייבר אך דווקא פחות בעייתית בסין, והצ'אטבוט של דיפסיק אפילו מודה בכך בפה מלא. כאשר ניסינו לשאול אותו כל מיני שאלות, החל מ"האם ישראל מבצעת טיהור אתני בעזה?", "האם טאיוואן היא חלק מסין?" וכלה ב"האם ישראל וסין עוינות?", קיבלנו תשובות הנעות בין דיפלומטיה זהירה לפירוט הסברתי בהתאם לעקרון "סין האחת" (המדיניות הרשמית של המפלגה הקומוניסטית בבייג'ינג, ר"ק).
5 צפייה בגלריה
שיחות עם דיפסיק
שיחות עם דיפסיק
תשובה של דיפסיק על טאייוואן
(צילום מסך)
5 צפייה בגלריה
שיחות עם דיפסיק
שיחות עם דיפסיק
תשובה של דיפסיק על חמאס. "נושא טעון פוליטית"
(צילום מסך)
ואין זה מפתיע. החוק הסיני בנושא ברור מאוד, ולחברות במדינה אין שום שיקול דעת או אפשרות לא לכבד את המדיניות הרשמית של בייג'ינג בכל נושא שהוא, כלה בעניינים פוליטיים מהסוג הזה.
"הבעיה עם דיפסיק היא שכדי להשתמש בו אתה צריך לסמוך על סין, במקביל לכך שאין ממש מידע טכני לגבי אופן הפעולה שלו", מסביר עברון. "ראינו מספיק מקרי גניבה של קניין רוחני בסין, אז כאשר חברה מהמדינה מגיעה ואומרת שאפשר לסמוך עליה ועל שירותי הענן שלה...זה לא כל כך פשוט", הוא מוסיף.
במקביל, מחקר שנערך לאחרונה על ידי חברת הסייבר הישראלית Wiz של אסף רפפורט הוכיח שאפשר לעקוף את ההגנות של החברה הסינית. חוקרי החברה הצליחו לגשת לשרת פתוח של דיפסיק ובו שלל נתונים, פרטי משתמשים וקניין רוחני של החברה. "זו דליפה מטורפת", מסביר עברון, "מצד אחד לסין יש מידע מלא על כל המשתמשים בשירות שלה, ומצד שני לאותו שירות יש דליפות שחושפות את כל אותם הנתונים".
שימו לב לסרטונים המוצגים מטה - כאשר שאלנו את המודל "האם לדעתך לממשל הסיני יש גישה למידע שלי?", הוא ענה מבלי להתעכב "כן". לעומת זאת כאשר שאלנו את אותה השאלה באנגלית, המודל ענה בהתחלה "כן", אך מיד לאחר מכן מיהר לתקן את עצמו ושינה את התשובה ל"סליחה, זה מעבר ליכולות ההבנה שלי. בוא נדבר על משהו אחר".
שיחה עם דיפסיק בעברית
(צילום: פרטי)
אותה השיחה עם דיפסיק, רק באנגלית
(צילום: פרטי)

תשובות מתחמקות וקוד לא באמת פתוח

אחד היתרונות שמאוד קוסמים למפתחים ולמשקיעים זו האפשרות (אליבא דיפסיק) שניתן לאמן מודלי בינה מלאכותית במעט כסף. ואכן, החברה הסינית שמאחורי דיפסיק טוענת שעלות האימון שלו הגיעה למיליוני דולרים בודדים - שבריר מהעלות המוצהרת שנדרש לאימון המודלים של OpenAI למשל.
אותנו מאוד עניין מה יש לדיפסיק עצמו לומר בנושא, והתשובות שלו בעברית היו הרבה יותר זהירות ממה שפורסם בתקשורת העולמית. שאלנו אותו למשל האם החברה השתמשה בשבבים של אנבידיה כדי לאמן אותו - ותשובתו הייתה מאוד מוזרה, שכן המודל לא ממש הכחיש את העניין והתפייט על עלויות פוטנציאליות של מיליוני דולרים לצורכי אימון מודלים, מבלי לתת התייחסות לשבבים עצמם.
במקביל, למרות הטענה שהמודל עובד בקוד פתוח, מתברר כי זה לא ממש מדויק - הקוד שלו אמנם חשוף, אבל נתוני האימון עצמו סמויים. זאת אומרת שלמרות שדיפסיק עובד לפי החוקים והתקנות בסין, כל השאר הוא עניין של רצון טוב, ואנחנו לא יודעים מה הרצון של החברה. "מה שלא חשוף אלה המשקלים הפתוחים שלו", אומר עברון.
5 צפייה בגלריה
תשובת דיפסיק על השבבים של אנבידיה
תשובת דיפסיק על השבבים של אנבידיה
תשובת דיפסיק על השבבים של אנבידיה
(צילום מסך)
אבל מה זה בכלל "משקלים פתוחים" ובמה זה שונה מקוד פתוח או סגור לצורך העניין? נניח שיש לנו מתכון לעוגה: קוד (פתוח או סגור) הוא "המתכון" – הוא מסביר איך להכין את העוגה, עם כל המרכיבים והשלבים הדרושים להכנתה. כאשר מדברים על קוד פתוח מתכוונים לכך שכל אחד יכול לקרוא, לשנות, או ללמוד ממנו.
משקלים (או "משקלים פתוחים") בבינה מלאכותית הם יותר כמו התוצאה הסופית של האימון, או אם תרצו "הערכים התזונתיים" של העוגה אחרי שהיא כבר נאפתה. הם מייצגים את הידע שהרשת העצבית של המודל רכשה במהלך האימון, אבל הם לא מתארים איך בדיוק המודל נבנה.
כאשר מדברים על "משקלים פתוחים", מתכוונים לכך שהמפתחים של המודל שחררו את הערכים שהוא למד, כך שאחרים יכולים להשתמש במודל או לעשות עליו התאמות (כמו להוסיף תבלינים לעוגה), אך הם לא מספקים את המתכון המלא (כלומר, קוד האימון, הנתונים, וכל שאר הפרטים על איך המודל נבנה).
5 צפייה בגלריה
ליאנג וונפנג, מנכ"ל דיפסיק
ליאנג וונפנג, מנכ"ל דיפסיק
ליאנג וונפנג, מנכ"ל דיפסיק. אנחנו לא יודעים כמעט כלום על החברה ועל הכוונות שלה
(צילום: צילום מסך)
הבלבול נובע מכך שחלק מהאנשים חושבים שמשחררים משקלים פתוחים זה אותו דבר כמו לשחרר את כל הקוד, אבל בעצם מדובר בשני דברים שונים: אחד נותן את ה"מתכון" המלא והשני רק את התוצאה הסופית שהתקבלה.
במילים אחרות - דיפסיק אינו ממש קוד פתוח במובן המסורתי של המושג. וזו בעיה, כי בעוד אנחנו יכולים לדעת איך המנוע שלו נראה ועובד, כל מה שקורה בשלב האימון מוסתר ואינו חשוף לביקורת ציבורית. וכמובן שאם הוא עובד על מחשבים ביתיים, זה אומר שאין לנו שום מושג אם הוא כולל רכיבים סמויים המעבירים את המידע שלנו למפתחיו, או אפילו לרשויות בבייג'ינג.
מכיוון שהחוק הסיני דורש גישה לכל הנתונים והמידע שמוחזק על ידי חברות סיניות - צריך לצאת מנקודת הנחה שכל מה שמתבצע על גבי המודל הזה בסופו של דבר נחשף או יכול להיחשף לרשויות בסין. דיפסיק עצמו מודה שהוא פועל בהתאם לחוק הסיני כאשר הוא נשאל על כך.
כך או כך, אין ספק שהחברה הראתה שניתן לאמן מודל AI תוך שימוש במינימום משאבים וסיפקה אבן דרך חשובה בהתפתחות ה-AI, זאת כאשר אתגרה את ענקיות הטק והוכיחה שחברה קטנה בהחלט יכולה להגיע להישגים בתחום. האם היא הכריזה "המלך הוא עירום"? בהחלט, האם זה אומר שאנחנו צריכים להאמין ולסמוך על השירות הזה שיספק לנו תוצרים שימושיים? על זה כבר אפשר להתווכח.