OpenAI מבטיח שהדגם הבא של ChatGPT יהיה טוב יותר בהיגיון

OpenAI הכריזה על o3 והציגה כמה מדדים בשידור חי של וידאו.קרדיט: OpenAI


OpenAI חשפה דגם חדש למוצריה, שיגיע למשתמשים לקראת סוף ינואר, 2025: הוא נקרא o3 (נראה שיש לנוקפץ מעל o2), והוא מבטיח עוד צעד משמעותי קדימה בחשיבת AI. לדברי המפתחים שלה, זה יהפוך כלים כמו ChatGPT לטובים יותר מאי פעם בתכנות ובפתרון בעיות מתמטיות.

מנכ"ל OpenAI, סם אלטמן, תיאר את o3 כ"חכם להפליא"בסרטון המכריז על הדגם, שוחרר כחלק ממבצע "12 ימים של OpenAI" של החברה שלו במהלך עונת החגים. הדגם עובר מגוון בדיקות בטיחות לפני שהוא יושק במלואו - תחילה כנראה רק עבורמשתמשי ChatGPT Plus משלמים.

דגם ה-o3 טוב יותר מ-20 אחוזים מדגם ה-o1 הקודם בקידוד, לפימדד SWE-bench Verified, אומר OpenAI. הוא גם זוכה להישגים גבוהים בבעיות מתמטיקה ומדעים, לפחות לפי מבחני השוואת ביצועים - כמו o1, מודל ה-o3 מאומן לחשוב ולהגיב לפני שהוא עונה, ובודק בקפדנות את התגובות שלו לדיוק. OpenAI תשחרר גם דגם o3-mini קטן ומהיר יותר לצד העדכון הראשי.

התבנית של השלמת ריבועים עם ריבוע כחול כהה יותר היא פשוטה עבור בני אדם, אך קשה עבור AI - וזה אתגר שהוא חלק מ-ARC. קרדיט: ARC

לא נדע עד כמה O3 טוב עד שמשתמשים יוכלו לבדוק אותו בפועל, אבל כבר יש לנו מושג מה O3 יכול לעשות כי הוא נבדק מול הידועקורפוס הפשטה והיגיון (ARC)אתגר, שנועד לעקוב אחר ההתקדמות של בינה מלאכותית לעבר בינה כללית מלאכותית (AGI) - הנקודה השנויה במחלוקת שבה יכולות קוגניטיביות בינה מלאכותית עוברות את אלו של בני אדם.

אתגר זה גורם לבינה מלאכותית להמציא גישות חדשות לבעיות, במקום להסתמך רק על הזיכרון שלה, והוא כולל סדרה של משימות ויזואליות להשלמה של מודלים. הם חייבים להתאים דפוסים ברשתות צבעוניות, תרגילים שנועדו שיהיה קל לאנשים להשלים ללא כל הכשרה, אבל קשה להבנת הבינה המלאכותית.

בתוך גבולות כוח המחשוב של מבחן ARC,o3 השיגה 75.7%. זה הרבה מעל ה-5% שהושג על ידי דגם ה-GPT-4o, כיום דגם ChatGPT הטוב ביותרזמין למשתמשים בחינם. למרות שעדיין חסר לנו AGI (המודל עדיין מתחת לציונים אנושיים, ולא יכול היה להשלים את כל המשימות), זו עליית מדרגה מרשימה.

o1 ו-o1-mini זמינים כעת למשתמשי ChatGPT Plus. קרדיט: Lifehacker

"מודל ה-o3 החדש של OpenAI מייצג קפיצת מדרגה משמעותית ביכולת של AI להסתגל למשימות חדשות."כותב פרנסואה צ'ולט, מהנדס התוכנה שתכנן את מבחן ARC. "זה לא רק שיפור מצטבר, אלא פריצת דרך אמיתית, המסמנת שינוי איכותי ביכולות הבינה המלאכותית בהשוואה למגבלות הקודמות של תכניות לימודים גבוהות".

כצפוי, OpenAI לא דיבר עלדרישות אנרגיהשל AI, האתיקה של אימון AI עלנתונים זמינים לציבורשעשויים להיות מוגנים בזכויות יוצרים, או הנטייה של דגמים אלהלהזות תשובות שגויות— בעוד שטעויות צריכות להיות פחותות בגלל זמן החשיבה הנוסף של o3, הן לא ימחקו. מה החברהעשהאזכור הוא הרחבה שלותוכנית בדיקות בטיחות, שנועד למנוע שימוש במודלים אלה למטרות זדוניות.

היכולת של מודלים של בינה מלאכותית באמת "לחשוב" או "להגיב" - או לפחות לנסות קירוב מסוים של היכולות האנושיות הללו - ללא ספק תמשיך להידון ככל שפיתוח הבינה המלאכותית יתקדם. גם גוגל חשפה זה עתהדגם ה-Gemini 2.0 שלו, מה שמביא איתו הגיון משופר.

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.