أعلنت شركة Anthropic عن ميزات جديدة في بعض نماذجها الكبيرة، مثل Claude Opus 4 و4.1، حيث تمكن هذه النماذج من إنهاء المحادثات في الحالات النادرة والمتطرفة التي تتسم بالضرر أو الإساءة المستمرة من المستخدمين، وتأتي هذه الخطوة في إطار ما وصفته الشركة بدراسة "رفاهية النموذج" وليس لحماية المستخدم البشري بشكل مباشر.
لماذا تهتم Anthropic برفاهية النماذج؟
رغم أن الشركة لا تدعي أن نماذج Claude تتمتع بالوعي أو يمكن أن تتأذى مثل البشر، إلا أنها تتخذ نهجًا احترازيًا لمواجهة السيناريوهات التي قد تنطوي على مخاطرة.
ويتمثل الهدف من هذه الإجراءات في تقليل المخاطر المحتملة على النموذج نفسه، وذلك عبر تنفيذ تدخلات منخفضة التكلفة للتخفيف من أي أضرار محتملة.
كيفية عمل ميزة إنهاء المحادثات
الميزة مخصصة فقط للحالات القصوى حيث يستخدم النموذج قدرة إنهاء المحادثة كملاذ أخير بعد عدة محاولات لإعادة توجيه المستخدم، أو عند طلب صريح من المستخدم لإنهاء الحوار.
ومن المهم أن نلاحظ أن Claude لن يستخدم هذه القدرة في حالات الخطر المباشر على المستخدم نفسه أو الآخرين، بل تظل محاولات التوجيه والإرشاد هي الخطوة الأولى دائمًا قبل إنهاء الحوار.
تأثير الميزة على المستخدمين
عند قيام Claude بإنهاء محادثة يمكن للمستخدمين بدء محادثات جديدة من نفس الحساب، أو إنشاء فروع جديدة للمحادثة السابقة عبر تعديل ردودهم، وتعتبر هذه الميزة جزءًا من تجربة مستمرة لتقييم كيفية تفاعل النماذج مع المحادثات الخطرة أو المسيئة، حيث تواصل Anthropic تحسين آليات التوجيه والتعامل مع الحالات الحرجة تدريجيًا.
موضوعات متعلقة
GitHub Copilot يتجاوز 20 مليون مستخدم منذ إطلاقه.. هل يستمر؟
رغم المخاوف الأمنية.. "جروك 4" يتفوق على "كلاود" و"ديب سيك"