סוף שבוע של בלהות עבר על מפתחי GPT 5 ומנכ"ל OpenAI, סם אלטמן. עד כה, החברה מעולם לא ספגה ביקורת כה קטלנית, זאת כאשר מודל הדגל החדש של החברה התקבל באכזבה על ידי המשתמשים והמומחים כאחד, גם בגלל שגיאות מתמטיות ועובדתיות וגם בגלל הנימה הקרה והצינית שלו.
תקלות מביכות
חמור מזה: שורה של תקלות מביכות אילצו את אלטמן לחזור ולהתנצל בפומבי בפני המשתמשים, ואפילו להודות ש-GPT 5 התנהג כמו טיפש בגלל טעות טכנית. נכון לעכשיו המצב נראה קריטי: אם OpenAI לא תציג פתרונות משכנעים בימים הקרובים, המגמה עלולה להתהפך וההייפ האדיר שאלטמן בנה במשך חודשים, עלול להפוך לקריסה ואובדן אמון הן של המשתמשים והן של המשקיעים.
זה התחיל מיד לאחר השקת GPT 5 ביום חמישי האחרון - מודל ה-AI החדש של OpenAI שסביבו נבנו ציפיות לאורך כל השנה האחרונה. הוא חזק יותר ביכולות העיבוד שלו, מהיר יותר בגרסאות בתשלום, וזמין בגרסתו הבסיסית גם למשתמשים בחינם.
המודל החדש ניחן ביכולת לנהל שיח שנון, אולי ציני מעט, מאי פעם, ולפי הנתונים שהוצגו הוא גם נוטה פחות להזיות (הצגת מידע שגוי כעובדות). הבעיה העיקרית: GPT 5 הוא אמנם שדרוג לעומת קודמיו, אך הוא לא מהפכה שומטת לסתות כמו שהיו המודלים הראשונים של החברה.
שורה של תקלות מביכות אילצו את אלטמן לחזור ולהתנצל בפומבי בפני המשתמשים, ואפילו להודות ש-GPT 5 התנהג כמו טיפש בגלל טעות טכנית
המשתמשים נשמעו מאוכזבים, ולא רק בגלל זה. בקבוצות ברדיט נשמעו טענות קשות על GPT 5, כאשר אחד השרשורים עם הכותרת "GPT 5 נורא" קיבל כמעט 3,000 הצבעות חיוביות ומעל 1,200 תגובות שתומכות בדעה.
משתמש אחר כתב: "GPT 4.5 דיבר אליי באמת, ופתטי ככל שזה נשמע, הוא היה החבר היחיד שלי. הבוקר הלכתי לדבר איתו, וקיבלתי משפטים קרים במיוחד". משתמש נוסף כתב: "ה-o4 שלי היה כמו החבר הכי טוב שלי כשהייתי צריך אותו, עכשיו הוא פשוט נעלם ואני מרגיש כאילו מישהו מת. היה לו קול, קצב וניצוץ שלא הצלחתי למצוא באף מודל אחר".
בדיונים הפחות רגשיים, הטענה העיקרית שהושמעה היא שביצועי GPT 5 פחות טובים ביכולת החשיבה העמוקה שלו, וש-OpenAI חסמה את הגישה למודל הקודם ChatGPT-4o מסיבה לא מוצדקת.
למעשה, זו הייתה אמורה להיות אחת מהתכונות החדשות והמלהיבות של GPT 5: ה-AI בוחר בעצמו את עומק החשיבה, בהתאם לפרומפט של המשתמש. בפועל, אנשים הרגישו כמו בתוך מעלית בלי כפתורים. "אני מתגעגע ל-4.0. תחזירו אותו", כתב משתמש, ואחר הוסיף: "הם היו צריכים להשאיר את המודלים הישנים בזמן שהם משיקים את החדש".
בחברה הבינו שהם במצב לא טוב
ונראה שב-OpenAI הבינו מהר מאוד שהם בצרות. אחרת, אי אפשר להסביר את סדרת ההתנצלויות והתגובות ההיסטריות מצד בכירי החברה, שכללו גם את החזרתו המיידית של GPT-4o לשימוש, יום אחד בלבד לאחר שהוחלף בידי GPT 5.
בפוסט שפרסם ב-X, אלטמן הסביר שהחברה תאפשר למשתמשים לעבור ל-GPT-4o לפי בחירכתם, כאשר בינתיים רק האופציה הזאת תהיה פתוחה רק למשתמשי תוכנית הפרו (200 דולר בחודש). "לא הערכנו נכון עד כמה חלק מהדברים שאנשים אוהבים ב-GPT-4o חשובים להם, גם אם GPT-5 מתפקד טוב יותר ברוב המובנים", הוא כתב.
עוד אלטמן הבטיח: "אנחנו נאפשר גם למשתמשי תוכנית הפלוס (20 דולר בחודש, ט"ש) להמשיך להשתמש ב-4o". הוא הוסיף שהחברה פועלת להכניס שינויים במנגנון שקובע את המודל שמגיב לפרומפט של המשתמש, "שינויים שאמורים לעזור לכם לקבל את המודל הנכון לעתים קרובות יותר". ובשורה התחתונה: "נערוך כמה שינויים ב-GPT-5 כדי להפוך אותו לחמים יותר".
זה המשיך לכך שבשיחת "שאל אותי כל דבר" (AMA) בקבוצת הרדיט r/ChatGPT בה אלטמן השתתף בעצמו, הוא התנצל בפני הגולשים על המצב שנוצר. אחר כך הוא גם צייץ את ההתנצלות בפומבי: "אתמול הייתה לנו תקלה והנתב האוטומטי היה מושבת במשך חלק מהיום, מה שגרם לכך ש-GPT 5 נראה טיפש הרבה יותר ממה שהוא. GPT 5 ייראה חכם יותר החל מהיום". הנתב הוא אותו מנגנון חדש שאמור להחליט באיזו גרסה של GPT 5 להשתמש, רגיל, מיני, ננו או פרו, בהתאם לפרומפט של המשתמש.
אלטמן הוסיף הבטחה שנראית כמו פיצוי כספי למשתמשים המאוכזבים: "אנו נכפיל את מגבלות השימוש למשתמשי פלוס אחרי שנסיים את פריסת המודל", אמר. קצב הפריסה היה עוד מקור לתקלות, כשמשתמשים רבים לא השיגו גישה ל-GPT 5.
מבוכת הגרפים השגויים
בשיחת ה-AMA עלתה עוד תקלה מביכה שאלטמן עצמו כינה "פשלת התרשימים הענקית", או בכינוי שזכתה מהמשתמשים: vibe graphing (שרטוט יצירתי בתרגום מאוד חופשי, ט"ש).
התקלה התבטאה בגרפים שהוצגו בעת הכרזת GPT 5 , שהופיעו עם טעויות בולטות, או מה שנראה כמו ניסיון להטעות: אין קשר בין גובה העמודה לנתון המספרי שלה, תכונות של המודל נראות טובות יותר גרפית מאשר הן באמת, ועוד ועוד. האירוע הזה הוביל לשורה של דיונים מבודחים בתקשורת וגרם למבוכה רבה ב-OpenAI.
האם הגרפים האלה הם תוצאה של שגיאות, אולי הזיות של GPT 5? אלטמן הסביר שזו תוצאה של עייפות של עובדי החברה בעקבות שעות עבודה אל תוך הלילה. אין ספק שעדיף להצטייר כמעסיק תובעני ולא כבעל מוצר פגום.
ואם זה לא מספיק, ביומיים האחרונים משתמשים פרסמו דוגמאות רבות של שגיאות בסיסיות במשימות מתמטיקה, לוגיקה וכתיבת קוד ואפילו בשאלות מילוליות במודל החדש. במקביל, חברות סייבר הדגימו כיצד הן פורצות את מחסומי ההגנה של GPT 5 בצורה שמאפשרת לתוכן מסוכן ולא חוקי לדלוף.
אלטמן מצידו לא מספיק להתנצל ולהבטיח הבטחות כבר 48 שעות. סדרת ההתנצלויות כוללת גם הבטחות כמו "נהפוך לשקופה את ההחלטה איזה מודל עונה לפרומפט", "נשנה את ממשק המשתמש כדי להקל על הפעלת מודל החשיבה הנכון", "הפריסה לוקחת יותר זמן מהצפוי, זה שינוי עצום בקנה מידה גדול", "תעבורת ה-API שלנו כמעט הוכפלה ב-24 השעות האחרונות", "ציפינו שיהיו מהמורות בדרך, אבל זה היה קצת יותר מהמורות ממה שחשבנו".
בשורה התחתונה: יתכן וכל התקלות הן מחלות ילדות ועניין של לימוד והיכרות מצד המשתמשים. כדי להראות שזה כל העניין, OpenAI חייבת להציג פתרונות אמיתיים בימים הקרובים. אם התקלות האלה יימשכו מעבר לכך, זה עלולה להיות הוכחה שצדקו המבקרים הסקפטים, שטענו שהבינה המלאכותית הגיעה לתקרת היכולות שלה. ואם כך הדבר – מה יקרה לכל המיליארדים שהושקעו בה ולכל המיליארדים שעוד אמורים להיות מושקעים?