הסורה של ישראל: לייטריקס מציגה את התשובה שלה ל-OpenAI ולגוגל

מי אמר שאין יכולות פיתוח AI בישראל? חברת לייטריקס (Lightricks) חשפה היום (ג') את מה שהיא מגדירה מודל הווידאו המתקדם ביותר בעולם, עם 13 מיליארד פרמטרים ועם חידוש פורץ דרך: יכולת דחיסה של הווידאו פי 30, מה שהופך את יצירת הווידאו למהירה הרבה יותר וחסכונית בעלויות אחסון ועיבוד.  
מודל הווידאו החדש של לייטריקס
 (לייטריקס)
מודל "LTX Video-13B" של היוניקורן הירושלמי מתייצב בחזית הטכנולוגיה ליד ענקיות הבינה המלאכותית הבינלאומיות, בהן OpenAI עם המודל "סורה" (Sora), גוגל עם המודל 2 Veo, והענקיות הסיניות עליבאבא עם Wan וקואישו עם Kling. במקביל, שורה של חברות וידאו AI אמריקאיות נדחקות כעת לשורה השנייה של הטכנולוגיה.
"לא רק נהיה על המפה, אלא גם ניתן פייט לגדולים"
"אפשר לעשות את הדברים האלה כאן בישראל" אומר מנכ"ל לייטריקס, זאב פרבמן, בשיחה עם ynet. "נכון שעד עכשיו לא ראינו מודל פורץ דרך שיצא מישראל, אבל מהיום זה משתנה. זה מודל שישים את ישראל על המפה". 
לדבריו, יש בישראל שפע יכולות בשניים מתוך שלושת התחומים הנדרשים: יכולת מחקר ופיתוח שמבוססת על האקדמיה, ויכולת בניית תשתית שמבוססת על יוצאי 8200 ויחידות נוספות בצה"ל. המרכיב השלישי הוא גיוס ההון הנדרש: "אנחנו נצליח להביא את ההון, וישראל לא רק תהיה על המפה, אלא גם תיתן פייט לגדולים" הוא מוסיף.
"נכון שעד עכשיו לא ראינו מודל פורץ דרך שיצא מישראל, אבל מהיום זה משתנה. זה מודל שישים את ישראל על המפה"
לייטריקס, שמוכרת כמפתחת אפליקציות גרפיות לאייפון ולאנדרואיד, כמו Facetune ,Videoleap ואחרות, שינתה מיקוד ב-2022 ופיתחה את מודל ה-AI לווידאו ואת פלטפורמת יצירת הווידאו LTX Studio המבוססת על יכולות המודל. "מאוד היה חשוב לנו לתפור את המודל למידתנו, לעשות אותו מאוד יעיל ומהיר כדי שגם אפליקציות הסמארטפונים יוכלו להשתמש בזה", אומר פרבמן. 
המודל החדש שנחשף היום משפר את איכות הווידאו ואת כלי היצירה, כמו יצירת סרטון על בסיס תמונה בודדת או מספר תמונות, הוספת וידאו מג'ונרט לסרטונים קיימים, הוספת אלמנטים ויזואליים לווידאו ועוד. לדברי פרבמן, החברה מכוונת בין השאר לקהל יעד של יוצרי סרטי אנימציה, שהכלים החדשים ישפרו משמעותית את עבודתם.
החידוש הגדול: טכנולוגיית הדחיסה
החידוש הטכנולוגי המרכזי במודל החדש הוא טכנולוגיית הדחיסה, שמייצרת Compressed latent space. או במילים אחרות - יחידת הנתונים הבסיסית (Token) מכילה יותר פיקסלים ויותר פריימים. התוצאה: סרטון שחברות אחרות מייצרות ב-25 דקות, ניתן לייצור בתוך פחות מדקה בטכנולוגיה החדשה. "צוותים אחרים ניסו לעשות את זה עם תמונות, אבל זה הניסיון הראשון המוצלח לעשות את זה במודל ווידאו", טוען פרבמן. 
גלריה
יצירה ריאליסטית של סורה. מסתבר שקמה לחברת ה-AI האמריקאית מתחרה כחול לבן
(OpenAI)
חידוש נוסף מאפשר הרצה של מודל ה-AI על גבי מחשבים ביתיים שמצוידים בכרטיסים גרפיים של אנבידיה, במקום על גבי חומרת AI יקרה. לייטריקס מצליחה להתמודד עם נפח הזיכרון הנמוך יחסית של הכרטיסים הביתיים באמצעות ג'ינרוט הווידאו בשלבים (multi-scale rendering): בכל שלב משפרים את איכות הווידאו ואת הפרטים עד להשגת התוצאה הסופית, וזאת בעשירית מעלויות החומרה הרגילות. "לאנשים באקדמיה למשל, או לכל למי שרוצה להתנסות עם המודל, זה הרבה יותר נוח. זה פשוט הרבה יותר כיף, יותר מהיר ויותר פרודוקטיבי", פרבמן מסביר.
לאן הטכנולוגיה ממשיכה מכאן?
"OpenAI הציגה את GPT-4o עם יכולת לעשות שימוש במודלי AI מולטי-מודאליים, שבהם הטוקנים של הטקסט והטוקנים של התמונות חיים באותו מרחב. מה שהולך לקרות מעתה ואילך, אנחנו מדברים על שני הרבעונים הקרובים, זה מרוץ לפיתוח מודלי וידאו מולטי-מודאליים שמשלבים לא רק טקסט ותמונות אלא גם וידאו, אודיו ומוזיקה." 
"כך ניתן יהיה לכתוב או לייצר מוזיקה על בסיס הווידאו או להיפך, לתת למשל פס-קול ועל בסיסו לייצר וידאו. אז הדבר הבא שהולך להיות אצלנו זה גם מודלים מולטי-מודאליים וגם מודלים ענקיים שעוברים בכמות הפרמטרים את ה-100 מיליארד. זה הטופ של הטופ"
זאב פרבמן
(צילום: אייל מרילוס)
אז מה בעצם המוצרים שלכם כיום?
"החברה בנויה משלוש שכבות של מוצרים: שכבת המודלים  - זו טכנולוגיית הליבה. מעליה יש את שכבת ההטמעה - שזה ה-API שעוטף את המודל כדי שלקוחות יוכלו להשתמש בו. ומעל זה יש את שכבת המוצרים - אפליקציות מובייל, LTX סטודיו, שהוא מוצר יותר מקצועי, ומוצר שלישי שהגיע אלינו דרך הרכישה של חברת Popular Pays".
מה המודל העסקי, איך מרוויחים מזה כסף?
"כרגע אני חושב שיש חוסר ודאות מאוד גדול בעולם הטק מאיפה הערך יגיע – מדמי מנוי של מודל ה-AI , משכבת ה-API, או אולי בכלל משכבת המוצרים? בגלל שהמודלים השתפרו כל כך מהר בשנים האחרונות, לא היה צורך להשקיע בשכבת המוצר, כי היה מגיע מודל שפותר את הבעיה. אנחנו החלטנו שכרגע אנחנו רוקדים על כל שלוש החתונות, ותוך כדי התפתחות הטכנולוגיה אנחנו הולכים להבין מאיפה מגיע יותר ערך עסקי".
אבל בינתיים המודל ניתן לשימוש בחינם בקוד פתוח
"אנחנו לא עושים את זה רק ממניעים אלטרואיסטיים טהורים. כדי להיות תחרותי מול חברות ענק, כמו גוגל, מטא ו- OpenAIשגייסו מיליארדים, אנחנו חייבים את התמיכה של החוקרים באקדמיה ושל המפתחים, ולכן אנחנו חייבים שהמודל יהיה פתוח. אבל זה קורה עד תקרה מסוימת: בשנייה שעברת את ההכנסות של 10 מיליון דולר, אתה צריך לדבר איתנו על קבלת רישיון".