במרוץ ה-AI העולמי, שבו קו הגמר לא נראה באופק אבל ההישגים נקטפים לאורך הדרך, גוגל נותרה בחודשים האחרונים בדבוקה הקדמית של הרצים - לא נדחקת לאחור, אבל גם לא פורצת קדימה. אבל השבוע זה קרה: גוגל ניתקה מהקבוצה והשאירה את OpenAI, אנת'רופיק, xAI ודיפסיק (DeepSeek) מאחור.
4 צפייה בגלריה


מימין: בעלי xAI, אילון מאסק, מנכ"ל גוגל, סונדאר פיצ'אי, מנכ"ל אמזון, ג'ף בזוס ומנכ"ל מטא, מארק צוקרברג. כולם נמצאים עמוק בתוך תחרות ה-AI
(צילום: AP/Julia Demaree Nikhinson)
מצד שני, זה כנראה לא יימשך עוד הרבה זמן, והמתחרות כבר מציגות שיפורים לא מעטים משלהן, בהן כלי יצירת תמונות מרשים במיוחד מבית OpenAI ושדרוג מעניין למודל V3 של דיפסיק שטלטל את העולם. הנה שלושה אירועים גדולים שקרו השבוע, שכדאי להכיר:
גוגל מציגה את ג'מיני 2.5
הפריצה של גוגל הגיעה השבוע עם הצגת מודל ה-AI Gemini 2.5, או כמו שגוגל מתארת אותו – "מודל ה-AI החכם ביותר שלנו עד כה". למעשה, ג'מיני 2.5 היא משפחה של מודלי AI מסוג "מודלים חושבים", כמו שמכנה אותם גוגל. הביטוי הזה מקביל ל"מודלים היסקיים" שבו משתמשת OpenAI, שהציגה את המודל ההיסקי הראשון שלה (o1) אך לפני כחצי שנה. מדובר בחוד החנית של פיתוח ה-AI בחודשים האחרונים, וגוגל מתייצבת בחזית.
המתמודד הראשון מקרב משפחת מודלי ג'מיני 2.5 שנשלח לזירה הוא Gemini 2.5 Pro Experimental, ולא במקרה. בדירוגים המקצועיים של ביצועי המודלים השונים, הוא זינק באופן מיידי לראש הטבלה.
בנקודת הזמן שבדקנו, הוא הוביל בדירוגים של אתר Lmarena בתחומי הקידוד, המתמטיקה, הכתיבה היצירתית, ביצוע הוראות, שאלות ארוכות ועוד. אחריו השתרכו grok-3 של xAI, GPT-4.5 של OpenAI, ובמקום השביעי Deepseek-R1 הסיני (קרוב לוודאי שמאז כבר יש שינויים בדירוג).
ג'מיני 2.5 הוא כאמור מודל היסקי, שמסוגל לשקול את תשובתו, לבחון את דרך המחשבה שלו בשלבים, להשתמש בשיקולים לוגיים, הקשרים ודקויות, ולהציג תוצאות משופרות ומדויקות יותר.
הוא יודע להתמודד עם קלט רב-מודאלי מטקסט, אודיו, תמונות, סרטונים ומערכי נתונים גדולים, כולל מאגרי קוד שלמים עבור פרויקטי קידוד. אמנם רק שלושה חודשים עברו מאז הציגה גוגל את מודל החשיבה ג'מיני 2.0, אבל תהליך הפיתוח נמשך מאז, והוא כולל כעת מודל בסיס מורחב ואימון המשך (post-training) משופר.
הצעד של גוגל מקדם אותה בזירת ה-AI בנקודת זמן משמעותית לא רק בתחום עצמו, אלא גם במאבק שלה כנגד הממשל האמריקאי, שרואה בה מונופול ודורש לקטוע כמה מפעילויותיה הרווחיות ביותר: דפדפן כרום ופלטפורמת האנדרואיד.
OpenAI חשפה כלי יצירת תמונות חדש ועוצמתי במיוחד
ביום שלישי השיקה OpenAI כלי חדש ליצירת תמונות שהוטמע ב-ChatGPT, המסוגל לראשונה לייצר תמונות לא רק מטקסט, אלא גם מתמונות המוזנות אליו ישירות, זאת בעזרת מודל ההסקה של החברה GPT-4o. כמובן שהכלי החדש הפך באופן מיידי ללהיט ברשתות החברתיות, עם משתמשים רבים שהעלו את יצירות המופת אותן יצרו עם הצ'אטבוט.
מעניין לציין שלמרות שעם השקתו, כלי יצירת התמונות החדש של OpenAI היה פתוח לכלל המשתמשים, בגלל הפופולריות הגדולה שלו והעומס על שרתי החברה, זו החליטה נכון לעכשיו להשאיר אותו לשימוש רק עבור מנויים בתשלום בגרסאות הפלוס, הפרו ו- Team.
בפוסט שהעלה אמש (ד'), מנכ"ל החברה, סם אלטמן, הוא הודה שכלי יצירת התמונות פופולרי הרבה מעבר לציפיות שלו, והוסיף כי "לצערנו, ההשקה למשתמשים החינמיים תתעכב לזמן מה". אגב, אלטמן עצמו גם כן הצטרף לטרנד והעלה כמה תמונות משעשעות למדי אותן יצר עם הכלי החדש.
דיפסיק מציגה גרסה חדשה ל-V3 שטלטל את העולם
אבל התחרות המפחידה ביותר מתעוררת, אין ספק, ממזרח. חברת דיפסיק (DeepSeek) הסינית, שצצה משום מקום בדצמבר האחרון וטלטלה את עולמות ה-AI ועולמות ההשקעות ב-AI גם יחד, ממשיכה לעורר הדים.
השבוע פרסמה דיפסיק גרסה החדשה למודל V3 שלה, אותו מודל שזעזע את עולמנו אך לפני חודשים ספורים. המודל החדש מכונה בשם הכרונולוגי V3-0324, כבר זמין לשימוש בפלטפורמת הפיתוחHugging Face ולדברי החברה הוא מהיר פי שלושה מקודמו, וכולל שיפורים משמעותיים בתחומי החשיבה והקידוד. בציוץ ב-X החברה מציינת שהמודל החדש עולה בביצועיו על אלו של קלוד 3.7, ג'מיני 2.0 ו-Llama 3.3 של מטא.
ראוי לציין ש-V3 החדש אינו מודל היסקי ולכן אינו ניתן להשוואה ישירה מול ג'מיני 2.5 החדש של גוגל, אבל לא שכחנו את מודל R1 של דיפסיק שהוצג בינואר השנה. לא היה צריך להיות נביא כדי לנחש שגרסה חדשה של R1 תוצג בקרוב, ואכן גרסה R2 צפויה להגיע בחודש הקרוב. יהיה מאוד מעניין להשוות את יכולותיה, שפותחו בתנאי דלות, לאלו של פסגת היצירה מבית גוגל.
יש לדיפסיק יתרונות נוספים אטרקטיביים, למשל העובדה שהמודלים שלה מוצעים בחינם או קרוב לחינם, שהם זמינים גם בענן וגם להתקנה במחשב מקומי, ושהם בקוד פתוח – כלומר ניתנים לשימוש ולהתאמה לצרכי המשתמש. אלה יתרונות משמעותיים שלמתחרות הגדולות, זולת מטא (שמציעה גם היא AI בקוד פתוח), לא תהיה תשובה עליהם.
מצד שני, לחינם תמיד יש מחיר. והמחיר של דיפסיק בא בדמות היעדר הגנה על הפרטיות, שלא לומר העברת נתוני המשתמשים לשימושו של הממשל בבייג'ין. היעדר הגנות גם מאפשר שימוש במודלים של דיפסיק למטרות לא חוקיות ולא מוסריות, שהמתחרים באמריקה מקדישים משאבים רבים כדי למנוע אותן. בהודעה האחרונה של דיפסיק לא הייתה כל התייחסות לסוגיה.
אם ללמוד מהמקרה של חברה סינית מצליחה אחרת – טיקטוק – כדאי לדיפסיק למהר ולאמץ מדיניות הגנת פרטיות של ממש. בארה"ב גם החלו מהלכים שעלולים להסתיים באיסור על שימוש בדיפסיק בתחומי המדינה. מדובר גם במהלכים של ממשל טראמפ, על רקע דאגה לביטחון הלאומי האמריקאי, וגם ביוזמות חקיקה פרטיות.
לפי הדיווחים, המודיעין האמריקאי איתר קשר בין דיפסיק לבין חברת תקשורת סינית שנמצאת ברשימה השחורה האמריקאית. בעקבות זאת, כמה מסוכנויות הביטחון האמריקאיות הגבילו את הגישה לדיפסיק, בהן הצי האמריקני, משרד ההגנה, משרד המסחר ונאס"א. איסורים דומים על שימוש בטיקטוק לא הצליחו לעצור את הפופולריות הגואה של האפליקציה, וספק אם הם לבדם יועילו מול דיפסיק.