OpenAI تشدد الرقابة على الذكاء الاصطناعي لمواجهة التهديدات البيولوجية

أعلنت شركةOpenAI تدشين نظام رقابة جديد، لمتابعة نماذجها الأحدث "O3" و"o4-mini" بهدف الحد من استخدام هذه النماذج في الأنشطة الخطرة، وبالأخص المرتبطة بالأسلحة البيولوجية والكيميائية.

النظام الجديد وفقًا لتقرير السلامة الذي نشرته الشركة يعتبر جزءًا من نهج احترازي أكثر صرامة، يركز على مراقبة المحفزات التي قد تؤدي إلى توليد معلومات ضارة أو قابلة للاستخدام في أعمال عدائية، ويعرف هذا النظام باسم المراقبة المنطقية، ويعتمد على آليات دقيقة لرصد الطلبات المشبوهة ومنع النماذج من الاستجابة لها.

فعالية استباقية بمعدل رفض مرتفع

بحسب ما ورد في التقرير نجحت آليات النظام الجديد في رفض 98.7% من الطلبات المصنفة كخطرة، وذلك بعد جهود امتدت لحوالي ألف ساعة من الاختبار والتوثيق من قبل فريق "القبعة الحمراء"، الذي يتخصص في تقييم سلامة النماذج عبر سيناريوهات محتملة للإساءة.

وعلى الرغم من هذا الرقم المرتفع، أشارت OpenAI إلى أن هناك بعض المستخدمين الذين يحاولون التحايل على النظام بتغيير أسلوب الطرح، وهو ما يشكل ثغرة قائمة حتى الآن، ولهذا السبب لا تزال الرقابة البشرية عنصرًا أساسيًا في متابعة التفاعلات وضمان الالتزام بالسياسات.

نماذج تحت المجهر ومخاوف من التسارع

تعتبر نماذج "O3" و"o4-mini" من أكثر النماذج تقدمًا في تاريخ OpenAI، لكنها أيضًا من أكثرها حساسية من ناحية الاستخدام خاصة مع قدرتها على فهم وإنتاج معلومات في مجالات شائكة، ورغم أن الشركة تؤكد أن هذه النماذج لا تزال دون مستوى الخطر العالي، إلا أنها تخضع لرقابة مشددة بالمقارنة مع النماذج السابقة مثل GPT-4 وo1.

كما كشفت OpenAI عن اعتمادها آليات مماثلة لضبط محتوى الصور داخل نموذج GPT-4o لحماية المستخدمين من المحتوى الضار، خصوصًا ما يتعلق بالاستغلال أو العنف.

تساؤلات حول الشفافية في نموذج GPT-4.1

ورغم هذه الخطوات التنظيمية لا تزال بعض التساؤلات تطرح من قبل الباحثين بشأن غياب تقرير السلامة الخاص بنموذج GPT-4.1 الذي أُطلق مؤخرًا دون الكشف عن تفاصيل آليات الحماية الخاصة به، مما أثار قلق البعض من احتمال عدم مواكبة تدابير الأمان لسرعة التطوير.