באמצע יוני האחרון כולנו בילינו בריצה לממ"דים, מטוסי חיל האוויר תקפו בטהרן ונתב"ג היה סגור, אין יוצא ואין בא. המוצא היחיד מהארץ היה הנתיב הימי, וככה מצא את עצמו עידו כהן מחברת לייטריקס הישראלית מפליג על גלי הים התיכון בואכה קפריסין. משם הוא עלה על טיסה שהנחיתה אותו בעיר קאן, שם התקיים פסטיבל Cannes Lions.
מודל הווידאו החדש של לייטריקס
(לייטריקס)
זה לא שכהן הוא חובב כפייתי של כוכבי קולנוע, קאן לאיינס הוא בכלל פסטיבל של עולמות הפרסום והקריאייטיב. אבל אנשי משרדי הפרסום הגדולים, ואלה שמשתתפים ביצירה של התעשייה הענקית הזאת, הם בדיוק קהל היעד של לייטריקס.
זירת הווידאו AI רותחת
חברת היוניקורן הישראלית שצמחה עם אפליקציות מגניבות לאייפון, המציאה את עצמה עכשיו מחדש כאחת מהחברות המובילות בעולמות ה-AI הגנרטיבי בכלל, ויצירת וידאו באמצעות AI בפרט.
הכלי שפיתחה לייטריקס, LTX Video, מדורג בימים אלה בין עשרת כלי הווידאו AI החזקים בעולם, וזה לא עניין שבא בקלות כשאתה מתמודד מול ענקיות אמריקאיות מחד וענקיות סיניות מאידך. ובניגוד למרבית המתחרות שמציגות תינוקות מדברים וחתולים שקופצים לבריכה, ללייטריקס יש תוכניות מאוד קונקרטיות איך עושים מזה כסף, והדרך לשם עוברת באולפני הפקות הפרסומות ואולפני אנימציה. אפשר לנחש שהיא לא תסתיים שם.
זירת הווידאו AI רותחת בימים אלה. אם חשבנו ש-ChatGPT מעיף את המוח, מתברר שצ'אטבוטים שמייצרים סרטוני וידאו באמת מטרללים את העולם. זה התחיל עם "סורה" (Sora) של OpenAI, שבינתיים נדחקה מעט לאחור לטובת כוכבת העונה הנוכחית - Veo3 של גוגל.
Veo3 הוא ממשיך דרכו של Veo2 שעדיין ממוקם בצמרת כלי יצירת הווידאו העולמי. הכלי החדש, שהוצג לראשונה בכנס המפתחים של גוגל במאי השנה, מאפשר לייצר וידאו באיכות קולנועית כולל אודיו, באמצעות הנחייה (פרופמפט) טקסטואלית פשוטה. הסרטונים המופקים נראים מציאותיים ביותר ופס הקול מוסיף דיאלוגים מסונכרנים, רעשי סביבה, אפקטים קוליים ומוזיקת רקע.
מרהיב, ומדאיג
זה מדהים וגם מעורר דאגה: Veo3 מקרב אותנו הכי קרוב שאפשר ליצירת פייק-מציאות, שיהיה קשה שלא להשתכנע מהתוצרים שלה. וכדי להתמודד עם זה, גוגל הקימה מעקות בטיחות גבוהים סביב Veo3. כך למשל לא ניתן לייצר באמצעותו דמויות פוליטיות, סלבס וגם לא פורנו. חוץ מזה, כל סרטון מכיל "סימן מים" ושילוב של נתוני SynthID, טכנולוגיה לזיהוי תכני AI.
יצירה של Veo3
(גוגל)
חוץ מגוגל ומ-OpenAI יש עוד כמה חברות אמריקאיות בצמרת הווידאו AI העולמית, כמו למשל Runway, שבין המשקיעים בה נמנות אנבידיה, סיילספורס וגם גוגל עצמה, והיא מככבת עם כלי Gen4 שלה ועם קודמו Gen3. אמריקאיות נוספות הן Pika Art מפאלו אלטו, עם Pika2.0 שלה, שגייסה מאות מיליוני דולרים, Genmo מסן פרנסיסקו ששחררה את הכלי Mochi1 וגם מידג'רני (Midjourney) מסן פרנסיסקו, ש-V1 שלה נותן ביצועים בתחום הטקסט לווידאו.
יש גם חברות לא אמריקאיות בודדות שהצליחו לסלול את דרכן לצמרת, כאמור לייטריקס הישראלית, Haiper AI מלונדון ו-Luma Labs מאיסלמבד שבפקיסטן. אבל הסיפור האמיתי בזירה העולמית הוא עלייתן חסרת הפשרות של החברות הסיניות. למעשה החברות הסיניות חולשות על העולם כעת, עם טכנולוגיות שעולות על אלה של גוגל, OpenAI או כל חברה אמריקאית אחרת.
הזירה עליה מדובר היא Artificial Analysis שהפכה בחודשים האחרונים לשופטת בפועל בתחרות בין חברות ה-AI. הלידרבורד (דירוג) שלה הוא היכל התהילה של ה-AI, והוא מתעדכן תדירות. למעשה יש כמה וכמה לידרבורדים, כל אחד מכסה תחום אחר של AI. הרלוונטיים לעניינינו הם הדירוגים של כלי טקסט לווידאו (text2video) וכלי תמונה לווידאו (image2video).
עלייתו של הדרקון האדום
נכון למועד כתיבת הכתבה, המובילה ללא עוררין בצמרת העולמית, בשני הדירוגים גם יחד, היא בייטדנס (ByteDance) הסינית. כן, החברה שהביאה לכם את טיקטוק שעכשיו רוצה לאכול לכם את הראש עם הסרטונים הכי מדהימים שראיתם מימיכם. חטיבת ByteDance Seed שאחראית לכל פיתוחי ה-AI בחברה הוציאה לפני כמה שבועות את Seedance 1.0, שמאז קוצר רק הצלחה כשהוא עוקף ביכולותיו את Veo3, Veo2, סורה וכל האחרים.
Seedance 1.0 מייצר במהירות הבזק סרטונים מורכבים באיכות p1080, והוא מציג רצפי שוטים ארוכים, זוויות צילום רבות וגם מסוגל לשמור על אותן דמויות במעבר בין שוט לשוט. את כל זה עוד לא עשו. הוא גם מפענח היטב את ההנחיות שהוא מקבל, ממש מעורר השתאות. מצד שני מעקות הבטיחות שלו לא גבוהות כמו ב-Veo3, וזה מעורר דאגה.
רוצים עוד סינים? יש הרבה. חברת MiniMax משנחאי הציגה לאחרונה את Hailuo V2, שבוודאי פגשתם בסדרת הסרטונים החביבים שמציגים חתולים מבצעים קפיצות אולימפיות לבריכה. היילו עולה על Veo3 וסורה בקטגוריית התמונה לווידאו ומדורג קצת יותר נמוך בטקסט לווידאו, אבל יש לו יתרון מוחץ - הוא מוצע בקוד פתוח, מה שאומר שבינתיים הוא ניתן בחינם (המלצה: מהרו לרוץ ולנסות, ט"ש).
ואם מדברים על מעקות בטיחות - היילו מאפשר להסיר את סימן המים כפיצ'ר לגיטימי, תמורת תשלום. ולא נשכח כמובן את Kling 2.0 של חברת Kuaishou שממוקם גבוה בצמרת וריגש רבים כשהושק באפריל השנה (Kling2.1 עדיין אינו מדורג).
הענקית הסינית טנסנט (Tencent) תומכת בקואישו, אבל יש לה גם כלי משלה - Hunyuan Video, שמוצע בקוד פתוח. לענקית האחרת, עליבאבא (Alibaba) יש כלי ייצור וידאו שנקרא Wan 2.1 14B ולצידה מתמודדת עוד אחת מ"ששת הטיגריסים" הסיניים, חברת StepFun, שהוציאה כעת את כלי הווידאו Step-Video-T2V.
גם הישראלים חזק בתמונה
הצד הישראלי בכל הסיפור הזה מפתיע במיוחד. מה עושה חברה ישראלית בקרב ענקיות אמריקאיות מצד אחד וענקיות סיניות מהצד האחר? בתחילת מאי השנה לייטריקס שחררה את מודל הווידאו שלה LTX Video-13B, שהציג תכונות כמו 13 מיליארד פרמטרים ויכולת דחיסה גבוהה של הווידאו, מה שהופך את הכלי שמבוסס עליו לזול לשימוש, אפילו חינמי.
לייטריקס היא החברה הישראלית השנייה שמפתחת מודל AI גדול, לצד חברת AI21, אבל במקרה שלה זה ממקם אותה גבוה בדירוג: כלי ה-LTX Video v0.9.7שלה נמצא במקום התשיעי בתחום תמונה לטקסט.
אם משווים אותה למודלים בקוד פתוח בלבד, היא ממוקמת בצמרת העולמית, מעל Wan של עליבאבא, מעל Hunyuan Video של טנסנט ומקום אחד מתחת ל-Veo2 של גוגל. "זה באמת הישג די גדול", אומר בשיחה עם ynet ד"ר זאב פרבמן, מנכ"ל ומייסד משותף של לייטריקס, ואדם צנוע באופן כללי.
יש ללייטריקס עוד יתרון, והוא מודל כלכלי מוכח. פלטפורמת LTX Studio שלה, שמאפשרת גישה לכלי ה-AI, צומחת בקצב של 40% בחודש ופרבמן אומר שבחודש הקרוב היא צפויה להגיע לקצב מכירות של מיליון דולר בחודש.
אותו כלי AI זמין גם משתמשי Facetune, האפליקציה הוותיקה של לייטריקס, מה שמהווה עוד מקור הכנסות מה-AI. "הלוואי שזה היה הקצב כשהתחלנו את החברה", אומר פרבמן, "אז זה לקח לנו קצת יותר זמן אז להגיע למיליון דולר הכנסות חודשיות". כל זה עוד לא אומר שהמודל הכספי של הטכנולוגיה החדשה פתור. לייטריקס רוצה שישתמשו במנוע ה- LTX Video-13B ישירות, כמו שמשתמשים ב-Veo3: דמי מינוי על התקנת המודל או שימוש ב-API.
בניגוד לגוגל, המודל של לייטריקס ניתן בחינם, "עד שהלקוח מגיע להכנסות של 10 מיליון דולר". המודל העסקי הזה נועד למשוך מפתחים וחוקרים שמתקשים להתמודד עם העלויות של המתחרים. "הרבה פעמים אתה עובד באופן איטרטיבי (תיקונים חוזרים ונשנים) ואז המהירות והעלות יותר קריטיות. התמחור של VEO3 הוא 6 דולר לג'ינרוט. די קשה לעבוד ככה".
וכאן נכנסות לתמונה סוכנויות הפרסום. בלייטריקס חושבים שיש להם הצעה בעלת ערך עבורן, אמנם לא ביצירת סרטוני הפרסומת הסופיים, היכולות של ה-AI עוד לא מספיקות ברוב המקרים, אבל כן ביצירת גרסאות הדגמה והצעות קמפיין שניתן לייצר באמצעות AI. בלחיצת כפתור אפשר להחליף צבע חולצה, זווית צילום או סגנון קולנועי. אבל התיקונים התכופים בגרסאות האלה יהיו הרבה יותר זולים עם לייטריקס מאשר עם Veo3.
שוק יעד נוסף לטכנולוגיה החדשה הם אולפני האנימציה, ולייטריקס כבר נמצאת בשיתוף פעולה עם כמה אולפני אנימציה בבניית מודלים מותאמים. הרעיון כאן הוא לאמן את ה-AI על כמויות עצומות של סרטי אנימציה קודמים, כך שניתן יהיה לייצר באמצעותו קטעים חדשים על בסיס עיצוב שני פריימים – הראשון והאחרון. ה-AI ימלא את כל התוכן שביניהם. "המטרה היא להראות, שזה מוזיל להם עלויות באופן דרמטי" אומר פרבמן.
"אנחנו רוצים להראות לעולם שיש מודל עסקי חדש שאנשים עוד לא ראו"
"אנחנו רוצים להראות לעולם שיש מודל עסקי חדש שאנשים עוד לא ראו. אנחנו רוצים לפתוח את המודלים ולתת לאנשים לבנות עליהם אפליקציות ואנחנו רוצים להראות שהמודל הפתוח עושה שכל", הוא מוסיף.
בדרך לשם החברה חייבת לשמור על מקומה בצמרת חברות ה-AI העולמית, להתמודד מול מעצמות מארה"ב ומסין. כדי לעמוד בזה היא צריכה להוציא לשוק גרסה חדשה ומשופרת בכל פרק זמן, וזה אכן יקרה. כדי לשמור על יתרון טכנולוגי, החברה מתמקדת בפיתוח מודל מולטי-מודאלי, כלומר כזה שמשלב יכולות הבנה והפקה של טקסט ותמונה וגם אודיו ומוזיקה. למרות שברור שלשם הולכת כל התעשייה, זה מאוד לא קל לביצוע.
בשלב הזה רק לייטריקס וגוגל עם Veo3 יודעים לעשות את זה. "אנחנו נורא מתאמצים לדחוף ולהיות הראשונים בתחום עם מערכת פתוחה ושניים ביכולות אחרי גוגל" הוא אומר, "זה תחום מאוד תחרותי אז לא יפתיע אותי אם בייטדנס יוציאו משהו כזה בחודש הקרוב. אבל אנחנו ננסה להיות שם הכי למעלה שאפשר בתחרות".