أعلنت شركة OpenAI عن إصدار نموذج جديد يُدعى o1، وهو الأول في سلسلة من نماذج “الاستدلال” التي تم تدريبها لحل الأسئلة المعقدة بسرعة أكبر من البشر. يتم إطلاقه جنبًا إلى جنب مع نموذج o1-mini، الذي يتميز بحجم أصغر وتكلفة أقل. هذا النموذج المعروف أيضًا باسم نموذج “Strawberry” الذي طالما تم الترويج له في أوساط الذكاء الاصطناعي.
يُمثل o1 خطوة نحو هدف OpenAI الأكبر في تحقيق الذكاء الاصطناعي الذي يشبه البشر. يتمتع هذا النموذج بقدرات متفوقة على كتابة الأكواد وحل المشكلات المتعددة الخطوات مقارنة بالنماذج السابقة. ومع ذلك، فإن استخدامه مكلف وبطيء مقارنة بنموذج GPT-4o. تعتبر OpenAI أن هذا الإصدار بمثابة “معاينة” لتوضيح مدى تطور النموذج.
حاليًا، يمكن لمستخدمي ChatGPT Plus وفِرق العمل الوصول إلى o1-preview وo1-mini، في حين سيحصل المستخدمون في المؤسسات التعليمية والشركات على الوصول في وقت لاحق. ومن المتوقع أن يتم إتاحته للمستخدمين المجانيين لاحقًا، دون تحديد موعد رسمي. أما بالنسبة للمطورين، فإن تكلفة الوصول إلى o1 مرتفعة جدًا، حيث تبلغ 15 دولارًا لكل مليون رمز إدخال و60 دولارًا لكل مليون رمز إخراج.
تم تدريب o1 باستخدام خوارزمية جديدة وبيانات تدريب مصممة خصيصًا له. على عكس النماذج السابقة التي تعتمد على تقليد أنماط البيانات، يتميز o1 باستخدام تقنية التعلم المعزز (reinforcement learning) التي تعلم النموذج من خلال المكافآت والعقوبات. يستخدم أيضًا طريقة “سلسلة الأفكار” لمعالجة الاستفسارات بطريقة مشابهة للتفكير البشري.
توضح OpenAI أن o1 أقل عرضة للهلوسة مقارنة بالنماذج السابقة، لكنه لا يزال غير مثالي. ويتميز النموذج بقدرته على حل مشكلات معقدة مثل البرمجة والرياضيات بشكل أفضل، كما أنه قادر على شرح استنتاجاته. رغم ذلك، يظل النموذج أبطأ وأقل فعالية في بعض المجالات مقارنة بـ GPT-4o، مثل معالجة المعلومات الحقيقية.
تُعد قدرات o1 في حل المشكلات خطوة نحو تطوير أنظمة ذكاء اصطناعي ذاتية قادرة على اتخاذ القرارات، وهو ما تسعى OpenAI لتحقيقه في المستقبل.