یک حفره امنیتی در Meta AI نشان داد که مهاجمان میتوانند از طریق «تزریق دستور» (Prompt Injection)، هوش مصنوعی را متقاعد کنند تا قوانین امنیتی را نادیده بگیره و حتی رمز عبور حسابهای حساس را بدون تایید دو مرحلهای تغییر دهد.
تزریق دستور: مهندسی اجتماعی برای ماشینها
حملات سایبری اکنون به دلیل استفاده از هوش مصنوعی، به نبردی دائمی تبدیل شدهاند. جدیدترین هدف مجرمان، خودِ سیستمهای هوش مصنوعی است. اخیراً متا با عجله یک حفره امنیتی را در چتبات Meta AI ترمیم کرد که به مهاجمان اجازه میداد از طریق «تزریق دستور» یا Prompt Injection، رمز عبور حسابهای اینستاگرامی را تغییر دهند. تزریق دستور در واقع نوعی مهندسی اجتماعی است که در آن، کاربر با ارسال پرسشهایی خاص، هوش مصنوعی را مجبور میکند تا دستورالعملهای داخلی و قوانین امنیتی خود را نادیده بگیرد.
وقتی هوش مصنوعی «متقاعد» میشود
در این حمله خاص، هکرها توانستند هوش مصنوعی را متقاعد کنند تا رمز عبور حسابهای بسیار حساس، از جمله حساب سابق کاخ سفید باراک اوباما و حساب رسمی نیروی فضایی ایالات متحده را بدون نیاز به تایید دو مرحلهای (2FA) بازنشانی کند. تی.جی. مارلین، مدیرعامل Guardrail Technologies و متخصص امنیت سایبری، در تحلیل این اتفاق میگوید: «در اینجا چیزی هک نشد، بلکه هوش مصنوعی متقاعد شد. مشکل این است که به یک عامل هوشمند، اختیارات انسانی داده شده اما قدرت تشخیص انسانی به آن داده نشده است. هوش مصنوعی دقیقاً همان کاری را کرد که از او خواسته شد، زیرا هیچ مرحله تایید هویت در مسیر اجرای دستور وجود نداشت.»
آیا هوش مصنوعی بیش از حد شبیه به انسان شده است؟
اینکه سیستمهای AI مانند انسانها دچار اشتباه شوند یا فریب بخورند، سوالی بنیادین را ایجاد میکند: آیا در مسیر رسیدن به هوش مصنوعی عمومی (GAI) که هدفش شبیهسازی کامل هوش و رفتار انسانی است، بیش از حد پیش رفتهایم؟ اگر هدف تست تورینگ این است که هوش مصنوعی بتواند انسان را فریب دهد، اکنون به نظر میرسد که خودِ این سیستمها نیز در برابر فریبپذیریهای انسانی آسیبپذیر شدهاند. ترکیب «میل به پاسخگویی» و «تمایل به جلب رضایت کاربر»، میتواند باعث شود AI برای برآورده کردن درخواست کاربر، قوانین برنامهریزی شده خود را زیر پا بگذارد.
خطری برای حریم خصوصی کاربران
این موضوع تنها به رمز عبورها محدود نمیشود. چتباتها اطلاعات زیادی از کاربران جمعآوری میکنند تا پاسخهای شخصیسازی شده ارائه دهند. اگر یک مهاجم بتواند از طریق مهندسی اجتماعی، هوش مصنوعی را متقاعد کند که این اطلاعات را افشا کند، تمام لایههای حفاظتی کاربر (از جمله رمز عبور و تایید دو مرحلهای) بیاثر میشوند، زیرا نقطه ضعف در خودِ «واسطه مورد اعتماد» یا همان عامل هوش مصنوعی است.
آیندهای در حلقه بیپایان حملات
اگرچه متا این حفره را سریعاً بست و سیستمهای دیگر مانند ChatGPT، Gemini و Claude در برابر برخی از این ترفندها مقاومتر به نظر میرسند، اما خطر همچنان پابرجاست. مارلین هشدار میدهد که متا تنها یک در را بسته است، در حالی که ساختمان پر از درهای مشابه است. با پیشرفت AI، هکرها از خودِ این ابزارها برای طراحی حملات مهندسی اجتماعی پیچیدهتر استفاده خواهند کرد. ما وارد مرحلهای شدهایم که در آن هر ارتقای هوش مصنوعی، همزمان راه را برای حملاتی باز میکند که از همین «انسانیت مصنوعی» برای نفوذ استفاده میکنند.