הימים האחרונים במעבדות הבינה המלאכותית של מטא רושמים טלטלה משמעותית. יאן לקון (Yann LeCun), חוקר פורץ דרך ומי שנחשב לאחד מ"שלושת הסנדקים של ה-AI" (יחד עם ג'פרי הינטון ויהושע בנג'יו), צפוי לעזוב את החברה לאחר למעלה מעשור ולהקים סטארט-אפ חדש שימוקד כולו בטכנולוגיית "מודלי עולם" (World Models). על פי דיווחים ב"פייננשל טיימס" ובאתרי חדשות מרכזיים בארה"ב, לקון כבר החל בשיחות גיוס הון עבור המיזם, שצפוי לקרוא תיגר על הגישה השלטת כיום בענקיות הטק.
עזיבתו הצפויה של לקון, בן ה-65, מגיעה על רקע שינוי כיוון דרמטי שמוביל מנכ"ל מטא, מארק צוקרברג. מטא, בדומה לגוגל, OpenAI ואנת'רופיק, מקדמת קו אסטרטגי שמדגיש פיתוח מואץ ומונחה-מוצר של מודלי שפה גדולים דוגמת משפחת Llama. גישה זו, שצברה תאוצה לאחר ההצלחה הפנומנלית של ChatGPT, עומדת בניגוד מוחלט לתפיסתו של לקון.
לטענת לקון, כפי שהדגיש בנאומים שונים ברחבי העולם (כולל בכנסי AI בפריז וסיאול), מודלי שפה, המאומנים בעיקר על טקסט, מוגבלים ביכולתם להבין את העולם הפיזי, לתכנן פעולות מורכבות, או להסיק מסקנות סיבתיות ברמה אנושית. הוא השתמש באנלוגיה מחיי היומיום: "אנחנו לא יכולים לשחזר אפילו אינטליגנציה של חתול או של חולדה, שלא לדבר על כלב. הם מבינים את העולם הפיזי... כל חתול בית יכול לתכנן פעולות מורכבות ביותר ויש לו מודל סיבתי של העולם".
לקון טוען כי ילד בן ארבע, שהיה ער כ-16,000 שעות, קולט באמצעות ראייה ומגע כמות נתונים חושית (סנסורית) שעולה על כל הטקסטים עליהם אומנו המודלים הגדולים ביותר כיום (ושאימונם מקביל לכ-450,000 שנות קריאה אנושית). עבור לקון, היכולת לדמיין קובייה מסתובבת במרחב היא משימה פשוטה לאדם, אך בלתי ניתנת לביצוע עבור LLM המבוסס רק על טקסט.
מודלי העולם: מעבר לטקסט
האלטרנטיבה שלקון מציע, ושתעמוד במרכז הסטארט-אפ החדש, היא "מודלי עולם". מדובר במערכות בינה מלאכותית שמטרתן לבנות ייצוג פנימי וחישובי של המבנה, הדינמיקה והקשרים הסיבתיים של העולם הפיזי. מודל כזה, לדידו, יוכל לחזות את תוצאותיה של רצף פעולות לפני שהן מתבצעות, בדומה לאופן שבו בני אדם ובעלי חיים מתכננים ומבצעים משימות.
הפער האידיאולוגי שהוביל לעזיבתו של לקון ממטא מתמקד בהבדלים מהותיים בין מודלי השפה הגדולים (LLMs) השולטים כיום לבין מודלי העולם שהוא מבקש לפתח. בעוד ש-LLMs, דוגמת GPT-4 ו-Llama, מתבססים בעיקר על טקסט כתוב בכמויות אדירות במטרה לחזות את הטוקן (מילה) הבא ולייצר שיחה ושפה טבעית, לקון טוען כי הם סובלים מחוסר הבנה אמיתית של העולם הפיזי, ולמעשה מתפקדים כ"מתמטיקאים על עיוור". לעומת זאת, מודלי העולם נועדו להתבסס על נתונים חושיים (וידאו, מרחב, מגע) הנקראים Embodied AI (בינה מלאכותית מגולמת), ומטרתם העיקרית היא הבנת חוקי הפיזיקה והסיבתיות לצורך תכנון פעולות והסקה. האתגר העיקרי בגישה זו הוא הצורך בארכיטקטורות קוגניטיביות חדשות והתחייבות לטווח פיתוח ארוך ומורכב יותר.
2 צפייה בגלריה


השימוש בטקסט מגביל את הבינה המלאכותית במודלי השפה
(צילום: Ascannio / Shutterstock.com)
הגישה הזו אינה ייחודית רק ללקון. חוקרים בולטים נוספים, בהם פיי-פיי לי מסטנפורד (Fei-Fei Li), המנהלת את הסטארט-אפ World Labs, קוראים גם הם לפתח "אינטליגנציה מרחבית" (Spatial Intelligence) במקום להסתמך רק על שפה. חברות כמו גוגל DeepMind ואנבידיה (Nvidia) כבר משקיעות משאבים בפיתוח מודלי עולם כחלק ממחקר לטווח ארוך יותר.
העזיבה מגיעה גם בעקבות ארגון מחדש במטא: צוקרברג הקים את חטיבת "מעבדות סופר-אינטליגנציה" (MSL) ומינה את אלכסנדר וואנג, מייסד Scale AI בן ה-28, לעמוד בראשה. מהלך זה, שהוביל לפיטורים של מאות עובדים מקבוצת המחקר ארוך-הטווח שייסד לקון (FAIR), הציב את לקון הוותיק תחת הנהגה צעירה וחדשה הממוקדת במודלי שפה ושממהרת למסחר אותם, דבר שככל הנראה תרם לניכור ולפער האידיאולוגי.
עזיבתו של לקון משקפת מתח גובר בכל ענף ה-AI בין הניסיון למסחר פתרונות מהירים המבוססים על LLMs (המיינסטרים בארה"ב, אירופה וסין), לבין חזון מדעי של פיתוח אינטליגנציה כללית אמיתית (AGI) שדורשת חשיבה מחודשת של ארכיטקטורת הלמידה. הסטארט-אפ החדש של לקון מסמן התחייבות לטווח ארוך - לקון עצמו הודה כי פיתוח מודלי עולם ברמה הנדרשת עשוי לארוך עשור ואף יותר, מה שדורש סבלנות, מימון משמעותי, וניתוק מהלחץ של תאגיד ענק.






