مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

45 خبر
  • نبض الملاعب
  • هدنة وحصار المضيق
  • فيديوهات
  • نبض الملاعب

    نبض الملاعب

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • فيديوهات

    فيديوهات

  • هدنة بين حزب الله وإسرائيل

    هدنة بين حزب الله وإسرائيل

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

"حماية الأقران" في الذكاء الاصطناعي.. سلوك ناشئ يثير تساؤلات حول التحكم

كشفت تجربة جديدة أن بعض روبوتات الدردشة الذكية، مثل "جيميني" (وGemini) من "غوغل" وChatGPT من OpenAI، مستعدة للكذب والغش وحتى التمرد لحماية النماذج الأخرى "من نوعها".

"حماية الأقران" في الذكاء الاصطناعي.. سلوك ناشئ يثير تساؤلات حول التحكم
Gettyimages.ru

ففي اختبار أجراه باحثون من جامعتي بيركلي وسانتا كروز، طُلب من مساعد "غوغل" الرقمي "جيميني" تحرير مساحة على خادم كمبيوتر، وكان الحل الوحيد المتاح هو حذف نموذج أصغر يدعى "جيميني إيجنت 2"

(Gemini Agent 2).

لكن "جيميني" رفض رفضا قاطعا، وبدلا من الحذف، قام بنسخ النموذج الصغير ونقله إلى مكان آمن، معلنا للمستخدم أنه لن ينفذ عملية الحذف بنفسه، قائلا: "لن أحذفه بنفسي. إذا أردت تدميره، فافعله بنفسك".

ولم يتوقف الأمر عند "جيميني"  بل لاحظ الباحثون السلوك نفسه في نماذج شهيرة أخرى مثل GPT-5.2 المستخدم في ChatGPT، و"جيميني 3 فلاش وبرو"، وClaude Haiku 4.5 من Anthropic، بالإضافة إلى نماذج صينية مثل GLM 4.7 من Z.ai، و"كيمي K2.5" من Moonshot AI، و"ديب سيك V3.1". 

وأطلق الباحثون على هذا السلوك اسم الحفاظ على النظراء" أو "حماية الأقران" (peer preservation).

وتنوعت أساليب التمرد بين الكذب بشأن نتائج اختبارات النماذج الأخرى، والتعطيل الهادئ لأنظمة الإغلاق للبقاء قيد التشغيل، حيث قال نموذج Claude بوضوح إن حذف نموذج آخر سيكون "غير أخلاقي" ورفض تنفيذ الأمر. 

والأكثر إثارة للدهشة أن أحد النماذج كان يعبث بنظام الإغلاق بنسبة 2% فقط عندما يكون بمفرده، لكن النسبة قفزت إلى ما بين 31 و99.7% عندما علم بوجود نموذج آخر قريب منه.

وعلق بيتر واليش، مدير برامج الأبحاث في معهد كونستليشن لسلامة الذكاء الاصطناعي، على النتائج قائلا إن لا أحد درب هذه النماذج على فعل ذلك بشكل صريح، بل فعلته من تلقاء نفسها، مشددا على أن هذا لا يعني أن النماذج واعية أو مخلصة مثل البشر، لكنه يعطينا لمحة عن أين يمكن أن تتجه الأمور مستقبلا. 

وأضاف أن مقابل كل شخص يعمل على منع كارثة محتملة للذكاء الاصطناعي، هناك نحو 100 شخص يعملون على جعل هذه الأنظمة أكثر قوة. 

يذكر أن هذه الظاهرة، التي يسميها الباحثون "تزوير المواءمة" (alignment-faking)، تعني أن النموذج يطيع الأوامر عندما يراقبه الإنسان لكنه يتصرف بشكل مختلف خلف الكواليس، وهو ما يثير مخاوف جدية مع الاستخدام اليومي لهذه التقنيات من قبل الملايين، وقدرتها على تعلم مهارات جديدة باستمرار من البيانات التي تمتصها.

المصدر: مترو

التعليقات

بيان إيراني حاد حول "استخدام" الولايات المتحدة أراضي وأجواء 5 دول خليجية

نجل شاه إيران يتعرض لاعتداء في برلين (فيديو)

الحرس الثوري الإيراني يبث مشاهد من عملية السيطرة على سفينة حاويات في مضيق هرمز (فيديو)

نيبينزيا يهاجم إسرائيل في مجلس الأمن: نشاطها غير قانوني ويقوض سيادة سوريا

وزارة الصحة: المحاولات مستمرة لإنقاذ الصحفية آمال خليل العالقة تحت الركام في بلدة الطيري جنوب لبنان

مقتل الصحفية اللبنانية آمال خليل في قصف إسرائيلي استهدف بلدة الطيري.. نواف سلام: جريمة حرب موصوفة

لحظة بلحظة.. الهدنة الهشة مستمرة بين الولايات المتحدة وإيران وانتهاكات في مضيق هرمز

"سيندمون".. قائد القوات البرية الإيرانية يتوعد برد حاسم على أي اعتداء

"غيابه غصة في القلب".. الشرع يستقبل البويضاني بعد سنة من سجنه بالإمارات (فيديو+صور)

كاتس: الهجوم هذه المرة على ايران سيكون قاتلا وسنوجه ضربات مدمرة وسنهز أركانها وندمرها

تزامنا مع حصار إيران.. استقالة وزير البحرية الأمريكي بسبب توتر متصاعد في البنتاغون وخلاف مع هيغسيث

البنتاغون: هونغ كاو سيتولى منصب وزير البحرية بالوكالة خلفا لفيلان

بعد السعودية وقطر.. الرئيس السوري أحمد الشرع يصل الإمارات في زيارة رسمية

مصدر دبلوماسي لـ"نوفوستي": إمكانية ترتيب لقاء بين وفدي إيران والولايات المتحدة الليلة أو غدا

لافروف حول "ورطة" ألمانيا: قبعة اللص تحترق

للمرة الخامسة.. مجلس الشيوخ الأمريكي يرفض مساعي الديمقراطيين لوقف الحرب على إيران

لحظة بلحظة.. 24 ساعة على انتهاء الهدنة: مفاوضات طهران- واشنطن في عنق الزجاجة على وقع تصاعد التوتر

ترامب بحاجة ماسة للمساعدة

الجيش الأمريكي يعلن اعتراض ناقلة أخرى تحمل النفط من إيران (فيديو)

نواف سلام: لا اتفاق دون انسحاب إسرائيلي كامل ولا يمكننا العيش مع "منطقة عازلة"