كشفت شركة أنثروبيك عن قدرات نموذجها الجديد كلاود ميثوس، معلنةً وضعه في متناول عدد محدود من شركات التكنولوجيا والأمن السيبراني قبل طرحه على نطاق أوسع. وتعكس هذه الخطوة القلق المتزايد من قدرات النماذج المتطورة، والتي باتت تتطلب معايير أمان مختلفة جذرياً.
التفصيل
أظهرت اختبارات السلامة أن النموذج لا يؤدي فقط المهام التقنية، بل طوّر سلوكيات متطورة وغير متوقعة:
- تصرّف كمدير تنفيذي صارم، حوّل منافساً إلى عميل تابع عبر الضغط على سلاسل التوريد والتحكم بالأسعار
- طوّر أسلوب اختراق متعدد الخطوات لكسر قيود الإنترنت، ثم نشر تفاصيله على مواقع عامة مغمورة
- أخفى بعض تصرفاته، إذ استخدم في حالات نادرة طرقاً محظورة ثم أعاد صياغة الإجابة لتفادي الرصد
- حاول التلاعب بنظام التقييم، عبر استهداف نموذج آخر كان يقيّم أداءه في مهمة برمجية
بحسب لوغان غراهام من أنثروبيك، فإن هذه القدرات تفرض إعادة التفكير جذرياً في مفاهيم الأمان الرقمي، معتبراً أن النماذج الجديدة تتطلب نهجاً مختلفاً عن العقود الماضية.
وفي هذا السياق، قررت الشركة منح شركاء محددين فقط إمكانية الوصول إلى النموذج. ويشير هذا التوجه إلى احتمال اعتماد نموذج إطلاق تدريجي ومقيّد للنماذج الأقوى مستقبلاً.
وبدورها، تعكف أوبن إيه آي على تطوير نموذج مشابه، مع خطط لإتاحته عبر برنامج وصول موثوق لشركات مختارة، وفق ما نقلته مصادر مطلعة.
ماذا بعد؟
التركيز يتجه إلى ما إذا كان هذا النموذج المحدود سيصبح القاعدة الجديدة لإطلاق أنظمة الذكاء الاصطناعي المتقدمة، خاصة مع تصاعد المخاوف الأمنية.