אז אחרי כמה ימים של תהיות וספקולציות, גוגל נחשפה כאחראית למודל עריכת התמונות הוויראלי החדש "Nano Banana", שריגש מסיבות מובנות את הרשת. החברה הכריזה בימים האחרונים רשמית על Gemini 2.5 Flash, כלי AI חדש שמאפשר לקחת את יכולות עריכת התמונות צעד אחד קדימה.
4 צפייה בגלריה
פרומפט פשוט ושתי תמונות: "מר בין על הרקע של בניין ידיעות אחרונות"
פרומפט פשוט ושתי תמונות: "מר בין על הרקע של בניין ידיעות אחרונות"
פרומפט פשוט ושתי תמונות: "מר בין על רקע בניין ידיעות אחרונות"
(נוצר על ידי ג'מיני)
מדובר בפיתוח של "גוגל דיפמיינד" (Google DeepMind), חטיבת ה-AI המאוחדת של גוגל שקמה לפני כשנתיים על יסודות DeepMind, חברת הבת הבריטית של גוגל, ו-Google Brain, חטיבת ה-AI הכושלת של החברה.
אז אחרי שב-2016 פיתחו בדיפמיינד בינה מלאכותית שמנצחת את אלופי העולם במשחק 'גו', ואחרי שב-2020 פיתחו שם מודל להדמיית קיפול חלבונים, החברה עוסקת עכשיו במניפולציות על תמונות JPG. מה שמוכיח שאין עבודות קטנות, יש משתמשים קטנים.

עוד חשיפה מוזרה

ואנחנו מודים, בתור משתמשים קטנים התרגשנו עמוקות ממחולל התמונות המסתורי "ננו בננה" שהופיע לפתע בראש הדירוג באתר LMarena. האתר הזה מדרג את מודלי ה-AI על בסיס עימות ראש בראש ביניהם, והיה ברור שננו בננה הוא אכן מודל מצוין.
4 צפייה בגלריה
כד עם צמח מהגינה על רקע מדברי
כד עם צמח מהגינה על רקע מדברי
כד עם צמח מהגינה שלנו על רקע מדברי
(נוצר על ידי ג'מיני)
היה גם ברור שחברה אלמונית מארץ נידחת לא יכולה לפתח דבר כזה, ולכן עיקר הניחושים נטו להעריך שמדובר בגוגל. יש לציין שמאז טקס השקת דגמי הפיקסל החדשים, הם נוטים לאירועי חשיפת מוצרים קצת ביזריים.
ברדיט ההתרגשות הגיעה לשיאים. כולם מיהרו להתנסות במודל החדש וחזרו לספר שכן, הוא טוב. שהוא מפענח פרומפטים בצורה משופרת ומדויקת ושהתוצאות הסופיות בהחלט מרנינות. ההסתברות שמדובר בקמפיין וויראלי של גוגל הלכה והתחוורה כשחלק ממנהלי המוצרים בגוגל העלו לרשתות תמונות ואימוג'ים של בננות.
שלשום כאמור נחשף הקמפיין במלוא הדרו, כשהיכולות החדשות נפתחו לשימוש באמצעות אפליקציית ג'מיני והפלטפורמות הגרפיות של גוגל. בחברה הדגישו שהמודל החדש עושה שימוש ביכולות של Gemini 2.5 Flash בשמירה על דמות של אדם מסוים או בעל חיים מסוים, גם כשעוברים לג'ינרוט תמונה חדשה.
4 צפייה בגלריה
ימין: תקריב של כנף של פרפר שמאל: תמונה שג'מיני יצר עם הטקסטורה של הפרפר
ימין: תקריב של כנף של פרפר שמאל: תמונה שג'מיני יצר עם הטקסטורה של הפרפר
ימין: תקריב של כנף של פרפר שמאל: תמונה שג'מיני יצר עם הטקסטורה של הפרפר
(גוגל)
זו יכולת משופרת אכן, לעומת הנטייה המעצבנת של מודלי AI לשכוח את מאפייני האדם ולהראות בתמונה החדשה מישהו שנראה אחרת. המודל גם יודע לשנות מרכיבים בתמונה לפי הפרומפט שהוא מקבל, ובמקביל להותיר מרכיבים אחרים שהפרומפט לא התייחס אליהם. גם זו יכולת מבורכת.
אז מה עוד מציע המודל החדש?
  • שיפור בדיוק פרטי בני האדם בתמונה, כך שייראו דומים יותר לעצמם במציאות גם כשהצבתם אותם בשמלת בלט בראש מגדל בורג' חליפה בדובאי.
  • שילוב של דמויות משתי תמונות שונות. תמיד רציתם לחבק את הרצל על המרפסת המפורסמת ההיא? אז הנה ההזדמנות שלכם.
  • שינוי מאפייני החלל המצולם – צבע, תאורה, עיצוב ורהיטים. אם אין לכם כוח לסדר את החדר, תמיד תוכלו להשתמש בגוגל כדי לשלוח לאמא תמונה של החדר מסודר.
  • שילוב עיצובים: קחו את המראה הזוהר של שמלת הפייטים החדשה ועצבו איתו את המכונית הישנה של אבא.
4 צפייה בגלריה
עוד יצירה של הכלי החדש: מזלג ספגטי
עוד יצירה של הכלי החדש: מזלג ספגטי
עוד יצירה של הכלי החדש: מזלג ספגטי
(גוגל)

אדובי מגיבה, פוטושופ שותקת

למי שיש מחשבות לא מוסריות על שימושים אפשריים במודל החדש, בגוגל מזכירים שכל התמונות שנוצרות במערכת כוללות סימן מים גלוי, כלומר החותמת השקופה בפינת התמונה, וגם סימן מים דיגיטלי בלתי נראה בטכנולוגיית SynthID, שאותו קשה הרבה יותר להסיר.
ולסיום - האם Gemini 2.5 Flash יהיה פוטושופ קילר? אמנם אדובי הגיבה אתמול ואמרה שהיא תאפשר שימוש במודל החדש של גוגל במסגרת Adobe Firefly ו-Adobe Express, אבל לגבי פוטושופ – שם לא הייתה התייחסות.
אין ספק שהכלי החדש מציע דמוקרטיזיציה של ממש ביכולת לעשות בקלות מניפולציות על תמונות, בלי קורסים בהפעלת פוטושופ, וגם בלי העלות הנלווית לכך. והתוצאות כבר מתבטאות בשער המניות הצונח של אדובי.