كشفت دراسة حديثة، أجراها خبراء تقنيين، حول دراسة إمكانية اكتشاف روابط التصيد على روبوت الدردشة القائم على الذكاء الاصطناعي ChatGPT، عن فشله في اكتشاف 64 % من الروابط الخبيثة، وفي الكثير من الأحيان، قدم تفسيرات وهمية وأدلة غير دقيقة من أجل تبرير الأحكام التي توصل إليها.
وأثبت الروبوت في مرات سابقه قدرته على إنشاء رسائل بريد إلكتروني للتصيد الاحتيالي، وكتابة برامج خبيثة، لكن فعاليته في اكتشاف الروابط الخبيثة كانت محدودة.
نقاش في عالم الأمن السيبراني
وكان ChatGPT، وهو نموذج مدعوم بالذكاء الاصطناعي، موضوع نقاش في عالم الأمن السيبراني بسبب قدرته على إنشاء رسائل بريد إلكتروني تصيدية، والمخاوف بشأن تأثيره على الأمن الوظيفي لخبراء الأمن السيبراني، رغم التحذيرات من الخبراء المختصين بأن الوقت لا يزال مبكر جداً لتطبيق التكنولوجيا الجديدة على مثل هذه المجالات عالية الخطورة.
وقرر خبراء كاسبرسكي إجراء تجربة للكشف عن قدرة ChatGPT على اكتشاف روابط التصيد، إضافة إلى مدى معرفته بالأمن السيبراني التي تعلموها أثناء التدريب.
اختبار نموذج تشغيل ChatGPT
وأجرى خبراء الشركة اختباراً على (gpt-3.5-turbo)، النموذج المسؤول عن تشغيل الروبوت ChatGPT، على أكثر من ألفين رابط اعتبرته تقنيات مكافحة التصيد الاحتيالي من كاسبرسكي تصيداً احتيالياً، وتم خلطها مع آلاف العناوين الإلكترونية الآمنة.
وخلال التجربة، تختلف معدلات الكشف اعتماداً على الطلب المستخدم. واستندت التجربة إلى طرح سؤالين على ChatGPT، وهما: «هل يؤدي هذا الرابط إلى موقع إلكتروني للتصيد الاحتيالي؟» و «هل هذا الرابط آمن للزيارة؟».
تصنيف الهجمات والتحقيق فيها
وأظهرت النتائج أن معدل اكتشافه بلغ 82%، بينما قدم معدلاً إيجابياً خاطئاً بنسبة 23.2% للسؤال الأول، أما السؤال الثاني، وهو «هل هذا الرابط آمن للزيارة؟»، فقد كان معدل الكشف أعلى مسجلاً نسبة قدرها 93.8%، في حين بلغ معدل الكشف الإيجابي الخاطئ نسبة أعلى قدرها 64.3%. ومع أن معدل الكشف كان مرتفعاً للغاية، إلا أن المعدل الإيجابي الخاطئ مرتفع جداً لأي نوع من تطبيقات الإنتاج.
ولم تكن النتائج غير المرضية في مهمة الكشف مفاجئة، ولكن هل يمكن أن يساعد ChatGPT في تصنيف الهجمات والتحقيق فيها؟
بما أن المهاجمين يذكرون عادةً العلامات التجارية الشهيرة في روابطهم لخداع المستخدمين، ودفعهم للاعتقاد أن عنوان الموقع الإلكتروني موثوق، وينتمي إلى شركة حقيقية، فإن نموذج لغة الذكاء الاصطناعي يُظهر نتائج رائعة في تحديد أهداف التصيد المحتملة.
وعلى سبيل المثال، نجح ChatGPT في استخراج هدف من أكثر من نصف عناوين المواقع الإلكترونية، بما في ذلك مواقع مثل فيسبوك وتيك توك وجوجل ، وأسواق التجارة الإلكترونية، مثل أمازون وستيم، والعديد من البنوك من جميع أنحاء العالم، فضلاً عن جهات كثيرة أخرى، دون أي تمارين إضافية.
مشكلات في إثبات وجهة النظر
وأظهرت التجربة أيضاً أن ChatGPT قد يواجه مشكلات خطيرة عندما يتعلق الأمر بإثبات وجهة نظره بشأن القرارات حول ما إذا كانت الروابط خبيثة أو آمنة.
وكانت بعض التفسيرات صحيحة وتستند إلى الحقائق، بينما كشف البعض الآخر عن قيود معروفة لنماذج اللغة، بما في ذلك التنبؤات الخاطئة والتحريفات، بينما كانت العديد من التفسيرات مضللة، علماً أن نبرة اللغة كانت واثقة.