חכם יותר, אבל לא פורץ דרך: OpenAI השיקה את GPT 5

הדור הבא של ChatGPT הגיע: חברת OpenAI הציגה הערב (ה') את GPT 5, מודל הדגל החדש שלה, שמציב לדבריה "רף חדש לעולם הבינה המלאכותית". מדובר במודל אחוד ראשון מסוגו, שמשלב את יכולות ההסקה של משפחת מודלי ה-o , עם המהירות והתגובות השוטפות של סדרת ה-GPT. זה בתורו אמור להפוך את הצ'אטבוט מכלי ניהול שיחות חכם, לסוכן המסוגל לבצע משימות של ממש עבור המשתמשים.
או במילים אחרות - אם עד כה GPT ידע לענות על שאלות ולייצר לכם תמונות אנימה חביבות מפרומפטים, עכשיו הוא גם יכול לכתוב אפליקציות, לתזמן את היומן שלכם, להכין מחקרים שלמים – ואפילו להבין לבד מה הדרך הנכונה להגיב, בלי שהמשתמש יצטרך לשנות הגדרות.
"המודל הטוב ביותר בעולם"
כצפוי, המנכ"ל סם אלטמן לא חסך במחמאות על המודל החדש של החברה. לדבריו, "GPT 5 הוא צעד משמעותי בדרך שלנו לפתח בינה מלאכותית שיכולה להתעלות על בני אדם בעבודות החשובות ביותר", כשהוא כנראה מתכוון לבינה המלאכותית הכוללת (AGI), הגביע הקדוש של התחום. 
לטענתו, מה שהיה "בלתי נתפס בכל תקופה אחרת בהיסטוריה", הפך כעת למציאות. לצד זאת חשוב להדגיש ש-GPT 5, שאמנם מציג שיפורים לעומת הדור הקודם, הוא לא ה-AGI שכולם מדברים עליו. לכן, כך נראה, בחר אלטמן במודע להשתמש בניסוח מעומעם שכזה.
גלריה
מנכ"ל OpenAI, סם אלטמן, מציג את GPT5
(צילום מסך)
עוד הוכרז כי לראשונה, גם משתמשים חינמיים יקבלו כברירת מחדל גישה למודל מתקדם מהסוג הזה. לדבריו של ניק טורלי, סמנכ"ל ChatGPT ב-OpenAI, מדובר בחלק מהמאמץ של החברה "לוודא שהטכנולוגיה הזו אכן תגיע לאנשים".
הביצועים: קצת יותר טוב מהמתחרים
על פי מבחני ביצועים פנימיים של OpenAI, המודל החדש הצליח לגבור בתחומים מסוימים (אך לא בכולם, חשוב לשים לב. ד"ג) על מודלים מובילים כמו קלוד של אנת'רופיק, ג'מיני של גוגל וגרוק של xAI. 
לדוגמה, בתחום התכנות המודל זוכה לציון גבוה במיוחד של 74.9% בניסיון ראשון במבחן SWE-bench, כשהוא משאיר מאחור את Claude Opus 4.1 של אנת'רופיק, ואת Gemini 2.5 Pro של גוגל DeepMind. 
במבחנים אחרים, כמו Humanity’s Last Exam (שמודד יכולות מתמטיקה, מדעי הטבע ומדעי הרוח), הגרסה החזקה יותר, GPT 5 Pro, הצליחה להשיג ציון של 42% - מעט נמוך יותר מזה של Grok 4 Heavy של מאסק, שהגיע לציון של 44.4%. עם זאת, במבחן GPQA  שמדד ידע מדעי ברמת דוקטורט, GPT 5 Pro הצליח להגיע לציון מרשים של 89.4% - הגבוה ביותר מבין כלל המודלים שנבחנו. 
התוצאות שהציג GPT 5 במבחן Humanity’s Last Exam 
(OpenAI)
פחות טעויות, יותר שקיפות
ללא ספק אחת מנקודות התורפה הגדולות של מודלי בינה מלאכותית היא תופעת ה"הזיות", או המצאה של עובדות לא נכונות. לפי הנתונים שהוצגו באירוע, GPT 5 הצליח לצמצם את התופעה הזו באופן דרמטי – רק 4.8% מהתגובות הכילו שגיאות מהסוג הזה, זאת לעומת 20% במודלי GPT-4o ו- o3. 
אלכס ביוטל, ראש תחום הבטיחות ב-OpenAI, ציין כי GPT 5 מצליח בנוסף לדייק יותר בכל הנוגע לזיהוי בקשות מסוכנות, מה שמוביל לפחות סירובים לשאלות תמימות מצד אחד, וליותר דחיות של בקשות וניסיונות לנצל לרעה את המערכת. 
שדרוג לחוויית המשתמש
באופן משעשע למדי, כיומיים לאחר שמאסק ו-xAI הציגו את המצב ה"פיקנטי" החדש של גרוק, שמצטרף לשלל הישויות שכבר קיימות במערכת, השיקה OpenAI גם היא אפשרות לבחירה בין ארבעה מצבים, או אישיויות, שונים של הצ'אטבוט – הציניקן, הרובוט, המאזין הקשוב, והחנון. מה כל אחד מהם יודע לספק בפועל? את זה עוד נצטרך לגלות.
GPT 5  - לא פריצת הדרך לה רבים חיכו
(OpenAI)
בכל הנוגע למשתמשים בתשלום – אלו בתוכניות הפלוס (20 דולר בחודש) יקבלו גישה מורחבת למודל החדש, בעוד שמנויי הפרו (200 דולר בחודש) יקבלו גישה בלתי מוגבלת ל-GPT 5 ולגרסת הפרו החזקה יותר שלו. 
המפתחים צפויים לקבל גישה למודל דרך ה-API בשלוש גרסאות - gpt-5-mini ; gpt-5-nano ו- gpt-5, עם מחירים שמתחילים מ-1.25 דולר למיליון טוקנים קלט, ועד 10 דולר למיליון טוקנים פלט. 
האם זו באמת קפיצה קדימה?
GPT 5 מגיע לאחר שבוע עמוס עבור OpenAI, שבו החברה השיקה גם את gpt-oss, מודל הקוד הפתוח החדש שלה. אבל כמובן שכל העיניים נשואות למודל החדש שהוצג הערב, שנחשב לאחד המוצרים המצופים ביותר מאז פרץ ChatGPT לחיינו אי שם ב-2022.
אך למרות ההבטחות, כפי שזה נראה GPT 5 הוא לא בהכרח פריצת הדרך לה רבים ציפו. אבל כמו תמיד עם בינה מלאכותית, מבחני הביצועים הם רק חלק מהתמונה. השאלה האמיתית היא מה יקרה כשהמודל יתחיל לפעול בשטח.
פורסם לראשונה: 21:42, 07.08.25