OpenAI מבטיח שהדגם הבא של ChatGPT יהיה טוב יותר בהיגיון

OpenAI הכריזה על o3 והציגה כמה מדדים בשידור חי של וידאו.קרדיט: OpenAI

OpenAI חשפה דגם חדש למוצריה, שיגיע למשתמשים לקראת סוף ינואר, 2025: הוא נקרא o3 (נראה שיש לנוקפץ מעל o2), והוא מבטיח עוד צעד משמעותי קדימה בחשיבת AI. לדברי המפתחים שלה, זה יהפוך כלים כמו ChatGPT לטובים יותר מאי פעם בתכנות ובפתרון בעיות מתמטיות.

מנכ"ל OpenAI, סם אלטמן, תיאר את o3 כ"חכם להפליא"בסרטון המכריז על הדגם, שוחרר כחלק ממבצע "12 ימים של OpenAI" של החברה שלו במהלך עונת החגים. הדגם עובר מגוון בדיקות בטיחות לפני שהוא יושק במלואו - תחילה כנראה רק עבורמשתמשי ChatGPT Plus משלמים.

דגם ה-o3 טוב יותר מ-20 אחוזים מדגם ה-o1 הקודם בקידוד, לפימדד SWE-bench Verified, אומר OpenAI. הוא גם זוכה להישגים גבוהים בבעיות מתמטיקה ומדעים, לפחות לפי מבחני השוואת ביצועים - כמו o1, מודל ה-o3 מאומן לחשוב ולהגיב לפני שהוא עונה, ובודק בקפדנות את התגובות שלו לדיוק. OpenAI תשחרר גם דגם o3-mini קטן ומהיר יותר לצד העדכון הראשי.

התבנית של השלמת ריבועים עם ריבוע כחול כהה יותר היא פשוטה עבור בני אדם, אך קשה עבור AI - וזה אתגר שהוא חלק מ-ARC. קרדיט: ARC

לא נדע עד כמה O3 טוב עד שמשתמשים יוכלו לבדוק אותו בפועל, אבל כבר יש לנו מושג מה O3 יכול לעשות כי הוא נבדק מול הידועקורפוס הפשטה והיגיון (ARC)אתגר, שנועד לעקוב אחר ההתקדמות של בינה מלאכותית לעבר בינה כללית מלאכותית (AGI) - הנקודה השנויה במחלוקת שבה יכולות קוגניטיביות בינה מלאכותית עוברות את אלו של בני אדם.

אתגר זה גורם לבינה מלאכותית להמציא גישות חדשות לבעיות, במקום להסתמך רק על הזיכרון שלה, והוא כולל סדרה של משימות ויזואליות להשלמה של מודלים. הם חייבים להתאים דפוסים ברשתות צבעוניות, תרגילים שנועדו שיהיה קל לאנשים להשלים ללא כל הכשרה, אבל קשה להבנת הבינה המלאכותית.

בתוך גבולות כוח המחשוב של מבחן ARC,o3 השיגה 75.7%. זה הרבה מעל ה-5% שהושג על ידי דגם ה-GPT-4o, כיום דגם ChatGPT הטוב ביותרזמין למשתמשים בחינם. למרות שעדיין חסר לנו AGI (המודל עדיין מתחת לציונים אנושיים, ולא יכול היה להשלים את כל המשימות), זו עליית מדרגה מרשימה.

o1 ו-o1-mini זמינים כעת למשתמשי ChatGPT Plus. קרדיט: Lifehacker

"מודל ה-o3 החדש של OpenAI מייצג קפיצת מדרגה משמעותית ביכולת של AI להסתגל למשימות חדשות."כותב פרנסואה צ'ולט, מהנדס התוכנה שתכנן את מבחן ARC. "זה לא רק שיפור מצטבר, אלא פריצת דרך אמיתית, המסמנת שינוי איכותי ביכולות הבינה המלאכותית בהשוואה למגבלות הקודמות של תכניות לימודים גבוהות".

כצפוי, OpenAI לא דיבר עלדרישות אנרגיהשל AI, האתיקה של אימון AI עלנתונים זמינים לציבורשעשויים להיות מוגנים בזכויות יוצרים, או הנטייה של דגמים אלהלהזות תשובות שגויות— בעוד שטעויות צריכות להיות פחותות בגלל זמן החשיבה הנוסף של o3, הן לא ימחקו. מה החברהעשהאזכור הוא הרחבה שלותוכנית בדיקות בטיחות, שנועד למנוע שימוש במודלים אלה למטרות זדוניות.

היכולת של מודלים של בינה מלאכותית באמת "לחשוב" או "להגיב" - או לפחות לנסות קירוב מסוים של היכולות האנושיות הללו - ללא ספק תמשיך להידון ככל שפיתוח הבינה המלאכותית יתקדם. גם גוגל חשפה זה עתהדגם ה-Gemini 2.0 שלו, מה שמביא איתו הגיון משופר.

People Who Read This Post Also Like

2018-08-06

Powered By WordPress

OpenAI מבטיח שהדגם הבא של ChatGPT יהיה טוב יותר בהיגיון

People Who Read This Post Also Like

NES אינו מבוטא 'NES'

שולחן העבודה של האדוות בחלל

כיצד להשתמש בשאריות מטבח על הצמחים שלך מבלי ללמוד קומפוסט

איך לצפות בתוצאות הבחירות

יישום המחשב הווירטואלי הטוב ביותר: VirtualBox

5 דרכים מלוחות לתבל אבטיח

Leave a Reply Cancel reply

List of Popular

Recent Posts

Subscribe Now & Never Miss The Latest Tech Updates!

Powered By WordPress

Browse posts by popular tags

OpenAI מבטיח שהדגם הבא של ChatGPT יהיה טוב יותר בהיגיון

People Who Read This Post Also Like

Leave a Reply Cancel reply

List of Popular

Recent Posts

Subscribe & be the first to know!

Subscribe Now & Never Miss The Latest Tech Updates!