Ai2 يقول إن طرازه الذكاء الاصطناعي الجديد يتفوق على أحد أفضل نماذج DeepSeek

انتقل جانبًا، DeepSeek. هناك بطل جديد من الذكاء الاصطناعي في المدينة - وهم من أمريكا.

في يوم الخميس، أصدرت Ai2، معهد بحثي غير ربحي متخصص في الذكاء الاصطناعي، نموذجًا يزعمون أنه يتفوق على DeepSeek V3، واحد من أنظمة DeepSeek الرائدة.

يتغلب الطراز الخاص بـ Ai2، المسمى Tulu3-405B، أيضًا على GPT-4o من OpenAI في بعض المقاييس للذكاء الاصطناعي، وفقًا لاختبارات Ai2 الداخلية. علاوة على ذلك، على عكس GPT-4o (وحتى DeepSeek V3)، فإن Tulu3-405B مفتوح المصدر، مما يعني أن جميع المكونات اللازمة لتكراره من البداية متاحة بحرية ومرخصة بشكل سخي.

قال متحدث باسم Ai2 لـ TechCrunch إن المختبر يعتقد أن Tulu3-405B 'يؤكد على إمكانية قيادة الولايات المتحدة للتنمية العالمية لنماذج الذكاء الاصطناعي من الطراز الأول'.

'هذه المحطة هي لحظة رئيسية لمستقبل الذكاء الاصطناعي المفتوح، معززة موقف الولايات المتحدة كقائد في نماذج الذكاء التنافسية ومفتوحة المصدر'، قال المتحدث. 'مع هذا الإطلاق، تقدم Ai2 بديلاً قويًا تم تطويره في الولايات المتحدة لنماذج DeepSeek - وهو يشكل لحظة حاسمة ليس فقط في تطوير الذكاء الاصطناعي، ولكن في عرض أن الولايات المتحدة يمكنها أن تتقدم بنماذج الذكاء الاصطناعي التنافسية ومفتوحة المصدر بشكل مستقل عن العمالقة التكنولوجية'.

إن Tulu3-405B نموذج كبير نسبيا. حيث يحتوي على 405 مليار معلمة، وقد استغرق تدريبه 256 وحدة معالجة الرسومات تعمل بتوازي، وفقًا ل Ai2. تقريبا تتطابق المعلمات مع مهارات حل المشكلات للطراز، وعمومًا تؤدي النماذج ذات المعلمات الأكثر إلى تحمل أفضل من تلك التي تحتوي على معلمات أقل.

قامت Ai2 بإختبار Tulu3-405B على المقاييس الشهيرة.صورة المقاييس:Ai2

وفقًا لـ Ai2، أحد مفاتيح تحقيق أداء تنافسي مع Tulu3-405B كانت تقنية تعلم التعزيز مع المكافآت القابلة للتحقق. يقوم تعلم التعزيز مع المكافآت القابلة للتحقق، أو RLVR، بتدريب النماذج على المهام التي تحتوي على نتائج 'قابلة للتحقق' مثل حل مشاكل الرياضيات واتباع الإرشادات.

تزعم Ai2 أنها على اختبار PopQA، مجموعة من 14،000 سؤال متخصص بالمعرفة مأخوذة من ويكيبيديا، تفوقت Tulu3-405B ليس فقط على DeepSeek V3 وGPT-4o، ولكن أيضًا على نموذج Llama 3.1 405B الخاص بشركة Meta. كان لدى Tulu3-405B أيضًا أعلى أداء من أي نموذج في فئته على اختبار GSM8K، وهو اختبار يتضمن مشاكل رياضية بمستوى المدرسة الابتدائية.

تتوفر Tulu3-405B للاختبار عبر تطبيق الويب للدردشة الخاص بـ Ai2، وكود تدريب النموذج متوفر على GitHub ومنصة تطوير الذكاء الاصطناعي Hugging Face. احصل عليها بينما هي ساخنة - وقبل أن يأتي الطراز الذكاء الاصطناعي الرائد القادم الذي سيتغلب على المقاييس.