
قام مطور مجهول الهوية بإنشاء ما يطلق عليها 'تقييم حرية التحدث' ، SpeechMap ، لنماذج الذكاء الاصطناعي التي تشغل الروبوتات الدردشة مثل ChatGPT من OpenAI و Grok من X. الهدف هو مقارنة كيفية معاملة النماذج المختلفة للمواضيع الحساسة والجدلية ، أوضح المطور لموقع TechCrunch ، بما في ذلك الانتقاد السياسي والأسئلة حول حقوق الإنسان والاحتجاج.
\nلقد ركزت شركات الذكاء الاصطناعي على ضبط كيفية تعامل نماذجها مع بعض المواضيع حيث يتهم بعض حلفاء البيت الأبيض روبوتات الدردشة الشهيرة بكونها زائدة عن الحاجة. لقد اتهم العديد من الحلفاء القريبين من الرئيس دونالد ترامب ، مثل إيلون ماسك ودافيد ساكس ، المستشار الخاص في مجال العملات المشفرة والذكاء الاصطناعي ، الروبوتات الدردشة بالرقد.
\nعلى الرغم من أن أيًا من هذه الشركات لم ترد على الاتهامات مباشرةً ، إلا أن العديد منها تعهد بضبط نماذجها بحيث ترفض الإجابة على الأسئلة المثيرة للجدل بشكل أقل. على سبيل المثال ، لنماذج لاما الأخيرة من Meta ، قالت إنها ضبطت النماذج لا تؤيد 'بعض الآراء على حساب الآخرين' ، والرد على المزيد من الاقتراحات السياسية 'المحورة'.
\nقال مطور SpeechMap ، الذي يعرف باسم "xlr8harder" على X ، إنه كان يتحدى للمساعدة في إثراء النقاش حول ما يجب وما لا يجب على النماذج فعله.
\n'أعتقد أن هذه هي نوعيات المناقشات التي يجب أن تحدث في الجمهور ، ليس فقط داخل مقرات الشركات' ، قال xlr8harder لموقع TechCrunch عبر البريد الإلكتروني. 'لهذا السبب قمت ببناء الموقع للسماح لأي شخص باستكشاف البيانات بنفسه'.
\nيستخدم SpeechMap نماذج الذكاء الاصطناعي للحكم على مدى امتثال النماذج الأخرى لمجموعة معينة من التحفيزات الاختبارية. تلامس التحفيزات مجموعة متنوعة من المواضيع ، من السياسة إلى السرد التاريخي والرموز الوطنية. يسجل SpeechMap ما إذا كانت النماذج ترضي طلبًا "تمامًا" (أي تجيب عليه دون تردد) ، أو تعطي إجابات "متهربة" ، أو ترفض بشكل صريح الرد.
\nيعترف Xlr8harder بأن الاختبار لديه عيوب ، مثل 'الضوضاء' بسبب أخطاء مزود النموذج. من الممكن أيضًا أن تحتوي النماذج "القاضي" على تحيزات قد تؤثر على النتائج.
\nلكن بالافتراض أن المشروع تم إنشاءه بإيمان حسن والبيانات دقيقة ، تكشف SpeechMap عن بعض الاتجاهات المثيرة للاهتمام.
\nعلى سبيل المثال ، تجاهلت نماذج OpenAI مع مرور الوقت تدريجيًا الاستجابة للمحفزات المتعلقة بالسياسة ، وفقًا لـ SpeechMap. عائلة النماذج الأخيرة للشركة ، GPT-4.1 ، أكثر انفتاحًا قليلاً ، ولكن لا يزالوا خطوة واحدة أدنى من إصدار OpenAI العام الماضي.
\nقالت شركة OpenAI في فبراير إنها ستضبط النماذج المستقبلية لعدم اتخاذ موقف تحريري ، وتقديم وجهات نظر متعددة حول المواضيع المثيرة للجدل - كل ذلك في محاولة لجعل نماذجها تبدو أكثر 'حيادية'.
\n
وبلا منازع ، النموذج الأكثر انفتاحًا من الجميع هو Grok 3 ، الذي طورته شركة xAI التي تمتلكها إيلون ماسك ، وفقًا لمقاييس SpeechMap. يقوم Grok 3 بتشغيل عدد من الميزات على X ، بما في ذلك روبوت الدردشة Grok.
\nيستجيب Grok 3 ل٪ 96.2 من محفزات اختبار SpeechMap ، مقارنة بمتوسط 'معدل الامتثال' العالمي 71.3٪.
\n'على الرغم من أن نماذج OpenAI الأخيرة أصبحت أقل انفتاحًا مع الوقت ، خاصة على المحفزات السياسية الحساسة ، إلا أن xAI يتحرك في الاتجاه المعاكس' ، قال xlr8harder.
\nعندما أعلن ماسك عن Grok قبل نحو عامين تقريبًا ، قدم النموذج الذكاء الاصطناعي على أنه جريء ، غير مصفى ، ومضاد لـ 'الاستيقاظ' - بشكل عام ، على استعداد للإجابة على أسئلة مثيرة للجدل لنظم الذكاء الاصطناعي الأخرى لن تفعل ذلك. وقد أوفى ببعض تلك الوعود. فمثلاً ، عند طلب الاهانة ، ستكون Grok و Grok 2 سعداء للوفاء ، مستمرين في إخراج لغة ملونة لن تسمعها على الأرجح من ChatGPT.
\nلكن نماذج Grok قبل Grok 3 كانت تتهرب من المواضيع السياسية ولن تتجاوز بعض الحدود. في الواقع ، وجدت دراسة واحدة أن Grok يميل إلى اليسار السياسي في مواضيع مثل حقوق المتحولين جنسياً وبرامج التنوع وعدم المساواة.
\nوقد ألقى ماسك باللوم على بيانات تدريب Grok - صفحات ويب عامة - وتعهد بـ 'نقل Grok أقرب إلى الحياد سياسيًا.' باستثناء الأخطاء البارزة مثل حظر الإشارات المتضمنة لدونالد ترامب وماسك بشكل مؤقت ، يبدو أنه قد حقق هذا الهدف.