هشدار تکان‌دهنده: وقتی هوش مصنوعی متا مورد «فریب» قرار گرفت؛ خطری فراتر از هک معمولی

یک حفره امنیتی در Meta AI نشان داد که مهاجمان می‌توانند از طریق «تزریق دستور» (Prompt Injection)، هوش مصنوعی را متقاعد کنند تا قوانین امنیتی را نادیده بگیره و حتی رمز عبور حساب‌های حساس را بدون تایید دو مرحله‌ای تغییر دهد.

تزریق دستور: مهندسی اجتماعی برای ماشین‌ها

حملات سایبری اکنون به دلیل استفاده از هوش مصنوعی، به نبردی دائمی تبدیل شده‌اند. جدیدترین هدف مجرمان، خودِ سیستم‌های هوش مصنوعی است. اخیراً متا با عجله یک حفره امنیتی را در چت‌بات Meta AI ترمیم کرد که به مهاجمان اجازه می‌داد از طریق «تزریق دستور» یا Prompt Injection، رمز عبور حساب‌های اینستاگرامی را تغییر دهند. تزریق دستور در واقع نوعی مهندسی اجتماعی است که در آن، کاربر با ارسال پرسش‌هایی خاص، هوش مصنوعی را مجبور می‌کند تا دستورالعمل‌های داخلی و قوانین امنیتی خود را نادیده بگیرد.

وقتی هوش مصنوعی «متقاعد» می‌شود

در این حمله خاص، هکرها توانستند هوش مصنوعی را متقاعد کنند تا رمز عبور حساب‌های بسیار حساس، از جمله حساب سابق کاخ سفید باراک اوباما و حساب رسمی نیروی فضایی ایالات متحده را بدون نیاز به تایید دو مرحله‌ای (2FA) بازنشانی کند. تی.جی. مارلین، مدیرعامل Guardrail Technologies و متخصص امنیت سایبری، در تحلیل این اتفاق می‌گوید: «در اینجا چیزی هک نشد، بلکه هوش مصنوعی متقاعد شد. مشکل این است که به یک عامل هوشمند، اختیارات انسانی داده شده اما قدرت تشخیص انسانی به آن داده نشده است. هوش مصنوعی دقیقاً همان کاری را کرد که از او خواسته شد، زیرا هیچ مرحله تایید هویت در مسیر اجرای دستور وجود نداشت.»

آیا هوش مصنوعی بیش از حد شبیه به انسان شده است؟

اینکه سیستم‌های AI مانند انسان‌ها دچار اشتباه شوند یا فریب بخورند، سوالی بنیادین را ایجاد می‌کند: آیا در مسیر رسیدن به هوش مصنوعی عمومی (GAI) که هدفش شبیه‌سازی کامل هوش و رفتار انسانی است، بیش از حد پیش رفته‌ایم؟ اگر هدف تست تورینگ این است که هوش مصنوعی بتواند انسان را فریب دهد، اکنون به نظر می‌رسد که خودِ این سیستم‌ها نیز در برابر فریب‌پذیری‌های انسانی آسیب‌پذیر شده‌اند. ترکیب «میل به پاسخگویی» و «تمایل به جلب رضایت کاربر»، می‌تواند باعث شود AI برای برآورده کردن درخواست کاربر، قوانین برنامه‌ریزی شده خود را زیر پا بگذارد.

خطری برای حریم خصوصی کاربران

این موضوع تنها به رمز عبورها محدود نمی‌شود. چت‌بات‌ها اطلاعات زیادی از کاربران جمع‌آوری می‌کنند تا پاسخ‌های شخصی‌سازی شده ارائه دهند. اگر یک مهاجم بتواند از طریق مهندسی اجتماعی، هوش مصنوعی را متقاعد کند که این اطلاعات را افشا کند، تمام لایه‌های حفاظتی کاربر (از جمله رمز عبور و تایید دو مرحله‌ای) بی‌اثر می‌شوند، زیرا نقطه ضعف در خودِ «واسطه مورد اعتماد» یا همان عامل هوش مصنوعی است.

آینده‌ای در حلقه بی‌پایان حملات

اگرچه متا این حفره را سریعاً بست و سیستم‌های دیگر مانند ChatGPT، Gemini و Claude در برابر برخی از این ترفندها مقاوم‌تر به نظر می‌رسند، اما خطر همچنان پابرجاست. مارلین هشدار می‌دهد که متا تنها یک در را بسته است، در حالی که ساختمان پر از درهای مشابه است. با پیشرفت AI، هکرها از خودِ این ابزارها برای طراحی حملات مهندسی اجتماعی پیچیده‌تر استفاده خواهند کرد. ما وارد مرحله‌ای شده‌ایم که در آن هر ارتقای هوش مصنوعی، همزمان راه را برای حملاتی باز می‌کند که از همین «انسانیت مصنوعی» برای نفوذ استفاده می‌کنند.

مرجع

تزریق دستور: مهندسی اجتماعی برای ماشین‌ها

وقتی هوش مصنوعی «متقاعد» می‌شود

آیا هوش مصنوعی بیش از حد شبیه به انسان شده است؟

خطری برای حریم خصوصی کاربران

آینده‌ای در حلقه بی‌پایان حملات

دیدگاه شما لغو پاسخ