מארק צוקרברג וחברת מטא הקימו ארבעה "חדרי מלחמה" של מהנדסים כדי להתמודד עם פריצת דרך אפשרית בטכנולוגיית בינה מלאכותית (AI) שפותחה על ידי סטארט אפ הבינה המלאכותית הסיני "דיפסיק" (DeepSeek) , כך דווח בימים האחרונים באתר The Information.
3 צפייה בגלריה
מארק צוקרברג בשימוע בסנאט
מארק צוקרברג בשימוע בסנאט
מארק צוקרברג. מטא בלחץ מההצלחה הסינית
(צילום: Evelyn Hockstein / Reuters)
נזכיר כי חברת דיפסיק, המגובה על ידי קרן הגידור הסינית High-Flyer, השיקה לאחרונה שני מודלים בולטים בתחום הבינה המלאכותית – הראשון הוא V3, שהושק בדצמבר 2024, והוא מודל שפה גדול (LLM) הדומה ל-ChatGPT של חברת OpenAI ומיועד להבנת שפה טבעית ויצירת טקסטים.
השני הוא R1, שהושק בינואר 2025 וכאמור עורר לא מעט סערה, והוא מודל חשיבה (Reasoning), המתמקד בפתרון בעיות מורכבות בתחומים כמו מתמטיקה, תכנות והנמקה. R1 מבוסס על V3, אך כולל התאמות המאפשרות לו לבצע תהליכי הסקה מורכבים יותר והוא דומה למודל o1 של OpenAI.
מעבר לעובדה שמדובר במודלים עוצמתיים המשתווים לאלו של ענקיות הטק האמריקאיות, מה שמפתיע יותר זו העובדה שהם פותחו בקוד פתוח, בעלות מגוחכת לעומת המודלים האמריקאיים (6 מיליון דולר לעומת מאות מיליונים) ותוך כדי שימוש בשבבים פחות מתקדמים של אנבידיה.
3 צפייה בגלריה
דיפסיק V3 - מודל הבינה המלאכותית הסיני שמטריד את המערב
דיפסיק V3 - מודל הבינה המלאכותית הסיני שמטריד את המערב
דיפסיק V3 - המתחרה של ChatGPT שמטריד את כולם
(צילום מסך)

החמ"ל של מטא

בהתאם, המודלים של דיפסיק העלו שאלות כבדות משקל בכל הנוגע להשקעות העצומות בתחום הבינה המלאכותית מצד חברות אמריקאיות, מה שבתורו גרם לצוות הבינה המלאכותית של מטא להיות בכוננות גבוהה ולצוקרברג להקים את החמ"ל המדובר.
לפי הדיווח, שהתבסס על שני עובדי מטא עם ידע ישיר בנושא, מתיו אולדהאם, מנהל תשתיות הבינה המלאכותית בחברה, אמר לעמיתיו שייתכן שהמודל החדש של דיפסיק עולה בביצועיו על הגרסה הבאה של- Llama, מודל הבינה המלאכותית של מטא, שאמור לצאת לפי החברה בתחילת 2025.
מבין ארבעת החמ"לים שהקימה מטא, שני צוותים מתמקדים בניסיון להבין כיצד הצליחה High-Flyer להפחית את עלויות האימון וההפעלה של דיפסיק, במטרה ליישם טקטיקות אלו על Llama . שני הצוותים הנוספים עובדים על זיהוי הנתונים שבהם השתמשה דיפסיק לאימון המודלים שלה, ובבחינת אפשרויות לשינוי מבנה המודלים של Llama בהתבסס על מאפייני המודלים הסינים.
3 צפייה בגלריה
נתונים אותם מציגה דיפסיק המציגים את המודל לעומת המתחרים
נתונים אותם מציגה דיפסיק המציגים את המודל לעומת המתחרים
נתונים אותם מציגה דיפסיק המציגים את המודל לעומת המתחרים
(דיפסיק)
"אנחנו מעריכים באופן קבוע את כל המודלים המתחרים כחלק מתהליך הפיתוח שלנו ועושים זאת מאז הקמת קבוצת Gen Al בחברה" מסר דובר מטא בהצהרה רשמית. "מודל Llama היה הבסיס להקמת האקוסיסטם למודלי AI בקוד פתוח, ואנחנו נרגשים להמשיך להוביל את התחום עם שחרור הגרסה הבאה", לשון ההודעה.

האמריקאים במבוכה

רק ביום שישי האחרון צוקרברג הכריז שמטא תשקיע עד 65 מיליארד דולר בפרויקטים הקשורים ל-AI בשנה הקרובה, כולל הקמת מרכז נתונים גדול וגיוס עובדים נוספים בתחום הבינה המלאכותית, זאת לאחר שבתחילת החודש, במהלך ראיון לפודקאסט של ג'ו רוגאן, הוא טען כי "בקרוב, ייתכן שכבר בשנה הקרובה, אנחנו (במטא, ד"ג) הולכים להשתמש ב-AI שיהיה בעל יכולות של מתכנת בדרג ביניים".
במקביל, האירוע הזה גורם מבוכה גם לנשיא הנכנס דונלד טראמפ, שהכריז החודש על מיזם ה-AI הגדול בהיסטוריה: השקעה של 500 מיליארד דולר בשורה של מרכזי נתונים ענקיים בארה"ב, שיהיו התשתית לפיתוח בינה מלאכותית מתקדמת.
האירוע הזה מעורר גם שאלות לגבי מדיניות הגבלת ייצוא שבבי ה-AI עליה הכריז הנשיא היוצא ביידן. הכוונה המקורית הייתה לשמור על מעמדה של ארה"ב כמובילה עולמית בתחום פיתוח ה-AI. אבל יכול להיות שהמעמד הזה יילקח על ידי חברות קטנות כמו דיפסיק, שאינן נזקקות לשבבים מתקדמים כדי לפתח מודלים מתקדמים.