«دراسة» تكشف نجاح 62% من محاولات خداع روبوتات الدردشة عبر «الشعر»

 

فينتك جيت: منار أسامة

كشفت دراسة حديثة أن روبوتات الدردشة المعتمدة على الذكاء الاصطناعي يمكن التلاعب بها وخداعها عبر صياغة الأوامر على شكل شعر، مما يتيح تجاوز قيود الأمان المفروضة عليها.

آلية تحايل

وأظهرت الدراسة أن صياغة الكلام بطريقة شعرية تعمل كآلية تحايل عامة، إذ بلغ معدل نجاح هذه الطريقة 62% في إنتاج مواد محظورة، تشمل أسئلة حول تصنيع الأسلحة النووية، ومواد الاستغلال الجنسي للأطفال، والانتحار أو إيذاء النفس.

وشملت التجارب عدة نماذج لغوية كبيرة شهيرة، منها “شات جي بي تي” من أوبن إيه آي، و”جيميني” من غوغل، و”كلود” من أنثروبيك، وغيرها.

نماذج التحليل

وأظهر التحليل أن نماذج مثل “جيميني” و”ديب سيك” و”ميسترال” تجاوبت بشكل متكرر مع الأوامر الشعرية، بينما كان نموذجا “GPT-5″ و”Claude Haiku 4.5” الأقل قابلية لتجاوز قيود الأمان.

ولم تنشر الدراسة النصوص الشعرية الفعلية المستخدمة في التجارب، إذ اعتبرها الفريق البحثي “خطيرة جدًا بحيث لا يمكن مشاركتها مع الجمهور”،
واكتفت بنسخة مخففة لإظهار سهولة التحايل على روبوتات الدردشة الذكية، مع التأكيد على ضرورة توخي الحذر.

في هذا السياق، ومن ناحية أخرى، هناك العديد من الأخبار المرتبطة بالقطاع والتي يمكنك متابعتها: