יש הרבה הבטחות סביב סוכני AI, הטכנולוגיה הכי נוצצת בעולמות הבינה המלאכותית. אבל יש איתה גם בעיה: היא לא ממש עובדת כמו שהיא אמורה. אלפי חברות בעולם משקיעות מאמצי פיתוח כבירים בכלי ה-AI האלה, אבל חוששות לשלח אותם לחופשי בגלל שאין דרך לפקח שהם לא עושים טעויות: עונים תשובה שגויה, נותנים הנחה שלא לצורך, גורמים נזק ללקוחות.
4 צפייה בגלריה
הבינה המלאכותית ושוק העבודה
הבינה המלאכותית ושוק העבודה
סוכני AI נשמע אולי כמו טכנולוגיה נוצצת, אבל בפועל מדובר בכלי שעדיין עושה לא מעט טעויות
(צילום: VesnaArt, Shutterstock)

איך מתמודדים עם סוכן משובש?

התרופה לכל מחלות הילדות האלה עשויה להימצא בטכנולוגיה של חברת "טרייסלופ" (Traceloop) הישראלית, שמפתחת כלים שיכולים להתריע ולהתמודד עם שגיאות בהתנהלות הבינה המלאכותית – עוד לפי שהיא גורמת לנזקים.
טרייסלופ, שנחשפת לראשונה, מדווחת היום (ג') על השלמת סבב גיוס ראשוני (סיד) בהיקף 6.1 מיליון דולר, בהובלת הקרנות Sorenson Capital ו-Ibex Investors ובהשתתפות Samsung NEXT, Y Combinator, ו- Grand Ventures. משקיעים נוספים בחברה הם אוליבייר פומל, מנכ"ל Datadog, מילין דסאי, מנכ"ל Sentry, ושי בנון, ממייסדי Elastic.
ניר גזית, מנכ"ל החברה, טוען שיש פער בין הציפיות של החברות שמפתחות סוכני AI לבין המציאות בשטח: "בחברות חושבים שאפשר לשאול את ה-AI שאלות על כל המידע בחברה והוא יענה, אבל זה לא עובד מספיק טוב".
4 צפייה בגלריה
צוות Traceloop
צוות Traceloop
צוות Traceloop
(אייל שני)
"אתה שואל אותו כמה שאלות, הוא עונה, אתה אומר 'זה עובד מדהים, איזה חכם הוא', ואז מוציאים הודעות לעיתונות ומשחררים אותו. מאוחר יותר מתברר שמדובר בכישלון, כי אתה לא יודע מה הלקוחות באמת ישאלו, והדברים לא עובדים כמו שצריך", הוא מסביר.
מדהים לגלות עד כמה היכולת לעקוב אחר ביצועי סוכן ה-AI מוגבלת, כאשר חברות אוספות נתונים ורק אז מגלות שהסוכן טועה. התיקונים נעשים בשיטת הניסוי והטעיה, ופעמים רבות נמשכים זמן ממושך. "זה המקום שבו אנחנו נכנסים", אומר גזית, "אנחנו אומרים לחברה: 'אני אעזור לך להבין איפה הסוכן עובד, איפה הוא מפשל, ואיך אפשר לשפר את ההוצאות".

הטכנולוגיה לא באמת בשלה עדיין

ניסיון לרסן את סוכני ה-AI עלול להתגלות כמשימה מאוד מתסכלת, כפי שמתאר זאת גזית: "כשאתה כותב שורת קוד, היא תמיד עושה מה שהיא אמורה לעשות. מסוכן AI לעומת זאת, אתה צריך לבקש יפה ולקוות לטוב, כמו למשל 'בבקשה, אל תחזיר ללקוח כסף אלא אם כן בדקת קודם'. הוא בתגובה לפעמים יבדוק, ולפעמים לא יבדוק. למה? אלוהים יודע".
"כשאתה כותב שורת קוד, היא תמיד עושה מה שהיא אמורה לעשות. מסוכן AI לעומת זאת, אתה צריך לבקש יפה ולקוות לטוב"
ואכן, אחת התובנות שצצה כשבודקים כל הזמן את הבינה המלאכותית, היא עד כמה הטכנולוגיה הזו אינה בשלה באמת, ועד כמה ההצהרות שנאמרות לגבי יכולותיה רחוקות מהמציאות - כמו למשל ההבטחה שסוכני AI ישתלבו ביחד עם עובדים אנושיים בצוותי עבודה משותפים.
"אני חושב שאנחנו לא נהיה שם בעשר השנים הקרובות" אומר גזית, "יש פה קצת הפלגה לעולם המדע הבדיוני. יש מקרים שסוכנים עובדים טוב מאוד, אבל זה מאוד רחוק מלהיות מה שמתואר. אנשים בונים לפעמים הרים וגבעות על סמך ההבטחות האלו, וזה לא באמת המצב".
בעולם שבו AI כותב קוד, יש בכלל צורך בקוד פתוח שנכתב בעבודה קשה של אלפי מפתחים?
"בוודאי. ה-AI מצליח ב-80% מהמקרים והוא טוב בשימושים מסוימים, אבל את ה-20% האחרים הוא פשוט לא יודע לכתוב. אנחנו מקבלים המון תרומות קוד מכל מיני אנשים בעולם ומאוד קל לי לזהות אנשים שנעזרו ב- AI. אני ישר רואה שזה קוד שג'ונרט אוטומטית, אף אחד לא בדק שהוא הגיוני, והוא גם רחוק מלעבוד. בתור מהנדס תוכנה, עדיין 30% מהזמן אני אשכרה כותב קוד".
4 צפייה בגלריה
עובדים בסטארט-אפ
עובדים בסטארט-אפ
למרות הכל, נראה שמקצוע התוכניתן עוד רחוק מלהיעלם
(צילום: shutterstock)
אתה אומר פה משהו מרעיש, שמקצוע התוכניתן עוד רחוק מלהיעלם
"חד משמעית, אני חושב שפשוט העולם משתנה. כשאני הייתי באוניברסיטה, למדתי את שפת התכנות C. היום כולם כותבים בפייתון, אז אם לא הייתי לומד פייתון, הייתי מובטל. באותו אופן המתכנתים של היום צריכים ללמוד לעבוד עם כלי בינה מלאכותית. מי שילמד יהיה מדהים, יותר טוב ממה שהיה לפני שנה. מי שלא, כנראה שלא תהיה לו עבודה".
כל השיח הזה על ג'וניורים שלא מצליחים למצוא עבודה כי ה-AI מחליף אותם, הוא לא נכון?
"אני לא יודע, אנחנו גייסנו עכשיו שני ג'וניורים".

השאיפה: סוכני AI שיכולים באמת לדבר עם הלקוח

טרייסלופ הוקמה בסוף 2022 על ידי ניר גזית (CEO) וגל קליינמן (CTO). השניים הכירו ביחידה 81 במודיעין שם שירתו. לאחר גזית הצטרף לגוגל והיה ראש הצוות שפיתח כלי בינה מלאכותית תוך שימוש במודלי LLM פנימיים. לאחר מכן שימש כארכיטקט תוכנה ראשי בחברת פייבר. קליינמן הוביל את פיתוח פלטפורמת למידת המכונה של פייבר.
בשנה הקרובה החברה מתכננת להרחיב את יכולות הטכנולוגיה שלה, כאשר בין השאר התכנון הוא לתמוך בסוכני AI שיכולים באמת לשוחח עם לקוחות, ולא רק לכתוב טקסטים. "גם זה עולם שאנחנו רוצים להיכנס אליו. זה עולם שזז כל כך מהר ואנחנו בריצה מתמדת כבר שנתיים", מסביר גזית.
"המתכנתים של היום צריכים ללמוד לעבוד עם כלי בינה מלאכותית. מי שילמד יהיה מדהים, יותר טוב ממה שהיה לפני שנה. מי שלא, כנראה שלא תהיה לו עבודה"
אני תוהה עד כמה זה שוק של חברות כבר מפעילות סוכני AI מול לקוחות, או שוק של חברות שמשחקות עם הטכנולוגיה
"קודם כל, יש הרבה דברים שאתה לא רואה. אם תלך לחברות כמו 'מאנדיי' או 'הייבוב' או 'פייבר', תראה המון שימוש ב-LLM, בין אם בדברים שפונים ללקוח ובין אם לשימוש פנימי. עכשיו כבר זה מגיע למערכות שפונות לצרכנים, לא לאנשים טכנולוגיים. אנחנו חתמנו חוזה עם קרן פנסיה בארה"ב, שמשתמשת בסוכנים כדי לנתח מאות אלפי מסמכים רפואיים של לקוחות כדי להבין אותם. זה משהו שכבר עובד בשטח".
כמי שנמצא עם האצבע על הדופק, מה הדברים שמדאיגים אותך בהקשר של AI?
"יש המון רעש, וקשה להבחין בין רעש לבין משהו אמיתי. נורא קל להשתמש ב-AI ואני חושב שאנשים לא מבינים את זה. כשעבדתי בגוגל ובניתי מודלים, זה היה כמו אומנות, משהו ליחידי סגולה. היום אתה לא צריך כמעט כלום וזה מאפשר לכל אחד להיכנס לתחום, לכן יש המון רעש. AI זה משהו מורכב, לא צפוי, ואנשים לא מבינים מה יש להם בידיים".
4 צפייה בגלריה
D-ID Agents מערכת בינה מלאכותית ליצירת אוואטרים
D-ID Agents מערכת בינה מלאכותית ליצירת אוואטרים
השאיפה הגדולה היא ליצור סוכנים שיכולים באמת לנהל שיחה עם הלקוחות, ולא רק להשיב תשובות
(צילום: D-ID)
אתה חושב שחברות ה-AI הגדולות עושות עבודה טובה ואחראית בפיתוח מודלי AI?
"אני חושב שכן ואני חושב שהדיבורים על בטיחות AI משרתים בעיקר אותן. היום לא תמיד קל להגיד באיזה מודל עדיף להשתמש, אז כל חברה רוצה לעשות רעש ולהגיד 'אנחנו הכי קרובים ל-AGI, המודלים שלנו הולכים להשתולל ולהשתלט על העולם. אבל זה שטויות, סתם פרסום".
יכול להיות שבכלל הגענו לתקרת הזכוכית של ה-AI, והוא לא יהיה יותר חכם ממה שהוא עכשיו?
"GPT 3 הצליח עם שני טריקים: קודם כל הוא היה גדול וראו שכשאתה מוסיף עוד פרמטרים למודל הוא נהיה יותר טוב. ואז גם הטכנולוגיה השתפרה והיה אפשר לבנות באמת עוד פרמטרים. והיום זה מפסיק לקרות. הגענו לתקרה מבחינת כמות הדאטה שיש לנו ואי אפשר באמת לבנות מודלים יותר טובים".
אולי זה רק עניין של זמן ובסוף אנחנו נראה AGI שיהיה כל כך יותר חכם מאיתנו
"אני חושב שזה יקרה כשתהיה הקפיצה הבאה. אני לא יודע כמה זמן זה ייקח. זה יכול לקרות מחר בבוקר ויכול לקרות גם בעוד 30 שנה. אבל כרגע זה לא קורה".
לדבריו של אהרון רינברג, שותף בקרן אייבקס שהובילה את הגיוס, "אני נזכר במשפט שאמר נשיא ארה"ב המנוח, רונלד רייגן: 'trust but verify'. זה לא סוד שמודלי שפה גדולים (LLMs) מהווים קפיצת מדרגה באינטראקציה שבין בני אדם למידע. עם זאת, הביטחון שמפגינים הסוכנים, לצד הפוטנציאל לטעויות, הופכים אותם למסוכנים. גוגל, IBM, Dynatrace וחברות נוספות כבר מסתמכות על הטכנולוגיה המרכזית של טרייסלופ, כדי להבטיח שסוכני ה- AI יתפקדו היטב. אני צופה שהאימוץ של כלי אימות יהיה אף בקצב מהיר יותר מאימוץ של המודלים עצמם".