مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

60 خبر
  • مونديال 2026
  • العملية العسكرية الروسية في أوكرانيا
  • فيديوهات
  • مونديال 2026

    مونديال 2026

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • تبادل الضربات بين إسرائيل وإيران

    تبادل الضربات بين إسرائيل وإيران

  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

"حماية الأقران" في الذكاء الاصطناعي.. سلوك ناشئ يثير تساؤلات حول التحكم

كشفت تجربة جديدة أن بعض روبوتات الدردشة الذكية، مثل "جيميني" (وGemini) من "غوغل" وChatGPT من OpenAI، مستعدة للكذب والغش وحتى التمرد لحماية النماذج الأخرى "من نوعها".

"حماية الأقران" في الذكاء الاصطناعي.. سلوك ناشئ يثير تساؤلات حول التحكم
Gettyimages.ru

ففي اختبار أجراه باحثون من جامعتي بيركلي وسانتا كروز، طُلب من مساعد "غوغل" الرقمي "جيميني" تحرير مساحة على خادم كمبيوتر، وكان الحل الوحيد المتاح هو حذف نموذج أصغر يدعى "جيميني إيجنت 2"

(Gemini Agent 2).

لكن "جيميني" رفض رفضا قاطعا، وبدلا من الحذف، قام بنسخ النموذج الصغير ونقله إلى مكان آمن، معلنا للمستخدم أنه لن ينفذ عملية الحذف بنفسه، قائلا: "لن أحذفه بنفسي. إذا أردت تدميره، فافعله بنفسك".

ولم يتوقف الأمر عند "جيميني"  بل لاحظ الباحثون السلوك نفسه في نماذج شهيرة أخرى مثل GPT-5.2 المستخدم في ChatGPT، و"جيميني 3 فلاش وبرو"، وClaude Haiku 4.5 من Anthropic، بالإضافة إلى نماذج صينية مثل GLM 4.7 من Z.ai، و"كيمي K2.5" من Moonshot AI، و"ديب سيك V3.1". 

وأطلق الباحثون على هذا السلوك اسم الحفاظ على النظراء" أو "حماية الأقران" (peer preservation).

وتنوعت أساليب التمرد بين الكذب بشأن نتائج اختبارات النماذج الأخرى، والتعطيل الهادئ لأنظمة الإغلاق للبقاء قيد التشغيل، حيث قال نموذج Claude بوضوح إن حذف نموذج آخر سيكون "غير أخلاقي" ورفض تنفيذ الأمر. 

والأكثر إثارة للدهشة أن أحد النماذج كان يعبث بنظام الإغلاق بنسبة 2% فقط عندما يكون بمفرده، لكن النسبة قفزت إلى ما بين 31 و99.7% عندما علم بوجود نموذج آخر قريب منه.

وعلق بيتر واليش، مدير برامج الأبحاث في معهد كونستليشن لسلامة الذكاء الاصطناعي، على النتائج قائلا إن لا أحد درب هذه النماذج على فعل ذلك بشكل صريح، بل فعلته من تلقاء نفسها، مشددا على أن هذا لا يعني أن النماذج واعية أو مخلصة مثل البشر، لكنه يعطينا لمحة عن أين يمكن أن تتجه الأمور مستقبلا. 

وأضاف أن مقابل كل شخص يعمل على منع كارثة محتملة للذكاء الاصطناعي، هناك نحو 100 شخص يعملون على جعل هذه الأنظمة أكثر قوة. 

يذكر أن هذه الظاهرة، التي يسميها الباحثون "تزوير المواءمة" (alignment-faking)، تعني أن النموذج يطيع الأوامر عندما يراقبه الإنسان لكنه يتصرف بشكل مختلف خلف الكواليس، وهو ما يثير مخاوف جدية مع الاستخدام اليومي لهذه التقنيات من قبل الملايين، وقدرتها على تعلم مهارات جديدة باستمرار من البيانات التي تمتصها.

المصدر: مترو

التعليقات

السعودية.. سماع دوي انفجارات وبيان عاجل من منصة الإنذار المبكر في حالات الطوارئ

"الأمن القومي" بالبرلمان الإيراني: سنرد على استهداف الضاحية.. ترقبوا سماء الأراضي المحتلة الليلة

الحرس الثوري يهدد دول المنطقة: اللعبة الخطيرة ستطال كل مواقع الطاقة

موقع إيراني: وقعنا في الفخ

ترامب يكشف تفاصيل الاتفاق المرتقب مع إيران و"مصير" مجتبى خامنئي

غضب إسرائيلي متصاعد: الليلة إيران أنهت دور إسرائيل في المنطقة وحولتها لـ"ملطشة" الشرق الأوسط

بعد الهجوم الإيراني نتنياهو أمام أخطر اختبار: رد قاس أو ثمن سياسي باهظ

"خاتم الأنبياء" يتوعد إسرائيل: ردنا سيكون مدمرا في حال قصفتم إيران.. سنوجه ضربة ساحقة لتل أبيب

نتنياهو يعقد اجتماعا عاجلا لبحث تهديد إيران بضرب إسرائيل الليلة

بأوامر من نتنياهو وكاتس.. دمار كبير جراء استهداف الضاحية الجنوبية لبيروت (فيديوهات)

الحرس الثوري: العدو الصهيوني استهداف مواقع داخل إيران بصواريخ باليستية جوية

مخاوف إسرائيلية من صفقات عسكرية مصرية تركية قد تغير موازين القوى في المتوسط

إسرائيل تترقب ردا إيرانيا وشيكا وتستعد لهجوم صاروخي محتمل واسع على تل أبيب خلال ساعات

مسؤول أمريكي يكشف تفاصيل مكالمة ترامب مع نتنياهو

تحول استراتيجي إسرائيلي.. البنية التحتية الإيرانية في خطر

لبنان لحظة بلحظة.. وقف إطلاق نار شكلي بين "الحزب" وإسرائيل وضحايا بينهم ضباط لبنانيون

"إسرائيل هيوم": معادلة جديدة تشكلت وتساؤلات بشأن الخطوة التالية ضد طهران

الجيش الإسرائيلي يعلن تنفيذ غارات على أهداف عسكرية في غرب ووسط إيران

عراقجي يبحث مع نظرائه في فرنسا وبريطانيا وتركيا وقائد الجيش الباكستاني قصف إيران لإسرائيل