
أعلنت OpenAI يوم الأربعاء عن إطلاق o3 و o4-mini، نماذج جديدة للذكاء الاصطناعي مصممة لإيقاف العمل والعمل من خلال الأسئلة قبل الرد.
تطلق الشركة على o3 أكثر نموذج للتفكير متقدمًا على الإطلاق، حيث يتفوق على النماذج السابقة للشركة في الاختبارات التي تقيس القدرات الرياضية والبرمجية والإستدلالية والعلمية والفهم البصري. في هذه الأثناء، يقدم o4-mini ما تقول OpenAI إنه توازن تنافسي بين السعر والسرعة والأداء — ثلاث عوامل يفكر فيها المطورون غالبًا عند اختيار نموذج ذكاء اصطناعي لتشغيل تطبيقاتهم.
على عكس النماذج السابقة للتفكير، يمكن لـ o3 و o4-mini توليد الردود باستخدام أدوات في ChatGPT مثل تصفح الويب وتنفيذ رموز Python ومعالجة الصور وإنشاء الصور. ابتداءً من اليوم، تتوفر النماذج، بالإضافة إلى نسخة متغيرة من o4-mini تسمى "o4-mini-high" تقضي وقتًا أطول في صياغة الإجابات لتحسين موثوقيتها، لمشتركي خطط OpenAI Pro و Plus و Team.
النماذج الجديدة تأتي في إطار جهود OpenAI للفوز على Google و Meta و xAI و Anthropic و DeepSeek في سباق الذكاء الاصطناعي العالمي القاسي. في حين كانت OpenAI أول من أطلق نموذج تفكير للذكاء الاصطناعي، تبعتها منافسيها بسرعة بإصدارات تلائم أداء OpenAI أو تتجاوزه. في الواقع، بدأت نماذج التفكير في السيطرة على الحقل بينما تبحث مختبرات الذكاء الاصطناعي عن مزيد من الأداء من أنظمتها.
كاد o3 لم يُطلق في ChatGPT. أشار الرئيس التنفيذي لـ OpenAI، سام ألتمان، في فبراير إلى أن الشركة كانت تعتزم تخصيص المزيد من الموارد لبديل متطور يدمج تكنولوجيا o3. ولكن يبدو أن الضغط التنافسي دفع OpenAI في النهاية لعكس الاتجاه.
تقول OpenAI إن o3 يحقق أداءً متقدمًا على SWE-bench الموثق (بدون هياكل مخصصة)، وهو اختبار يقيس مهارات البرمجة، مسجلًا 69.1%. يحقق النموذج o4-mini أداءً مماثلاً، مسجلًا 68.1%. نموذج OpenAI التالي في الأداء، o3-mini، حقق 49.3% في الاختبار، بينما حقق Claude 3.7 Sonnet 62.3%.
تزعم OpenAI أن o3 و o4-mini هما أول نماذج لها يمكنها "التفكير بالصور". عمليًا، يمكن للمستخدمين رفع الصور إلى ChatGPT، مثل رسومات السبورة أو الرسوم التخطيطية من ملفات PDF، وسيحلل النماذج الصور أثناء مرحلة "سلسلة الأفكار" قبل الإجابة. بفضل هذه القدرة الجديدة، يمكن لـ o3 و o4-mini فهم الصور غير الواضحة والمنخفضة الجودة ويمكنها أداء مهام مثل التكبير أو تدوير الصور أثناء التفكير.
بالإضافة إلى قدرات معالجة الصور، يمكن لـ o3 و o4-mini تشغيل وتنفيذ رموز Python مباشرة في متصفحك من خلال ميزة Canvas في ChatGPT، والبحث في الويب عند سؤالها حول الأحداث الحالية.
بالإضافة إلى ChatGPT، ستتوفر كل من النماذج الثلاثة — o3 و o4-mini و o4-mini-high — عبر واجهات التطوير الخاصة بـ OpenAI، واجهة API لاكمال الدردشة وواجهة API للاستجابات، مما يسمح للمهندسين ببناء تطبيقات باستخدام نماذج الشركة بأسعار تعتمد على الاستخدام.
تفرض OpenAI على المطورين سعرًا منخفضًا نسبيًا لـ o3، نظرًا لتحسين أدائه، بمقدار 10 دولارات لكل مليون رمز مدخل (حوالي 750000 كلمة، أطول من سلسلة سيد الخواتم) و 40 دولارًا لكل مليون رمز مخرج. بالنسبة لـ o4-mini، تفرض OpenAI نفس سعر o3-mini، وهو 1.10 دولار لكل مليون رمز مدخل و 4.40 دولار لكل مليون رمز مخرج.
في الأسابيع القادمة، تقول OpenAI إنها تعتزم إطلاق o3-pro، إصدار من o3 يستخدم موارد أكثر لإنتاج إجاباته، حصريًا لمشتركي ChatGPT Pro.
أشار الرئيس التنفيذي لـ OpenAI، سام ألتمان، إلى أن o3 و o4-mini قد تكونا آخر نماذج للتفكير المستقلة في ChatGPT قبل GPT-5، نموذج قالت الشركة إنه سيربط بين النماذج التقليدية مثل GPT-4.1 ونماذجها للتفكير.