إنه جهاز خداع سينمائي شائع، حيث تعتقد الشخصية الرئيسية أنها شاهدت شخصًا ما يخطو على الطريق، لذلك تنحرف وينتهي بها الأمر في حفرة. تخيل الآن أنها حقيقية – نوعًا ما – وبدلاً من خدعة الضوء أو العقل، أن الصورة تأتي من مجرم إلكتروني، لجزء من الثانية، يسقط الضوء على شيء ما تتم برمجة الطيار الآلي للسيارة للاستجابة له. باحثون من جامعة جورجيا للتقنية وبن جوريون في النقب أثبتوا تهديد “الهجوم الوهمي” في مؤتمر RSA 2021.
إن فكرة عرض صور خطيرة على أنظمة الذكاء الاصطناعي ليست بالفكرة الجديدة. عادةً ما تتضمن الأساليب استخدام الصور المُعدلة لإجبار الذكاء الاصطناعي على استخلاص نتيجة غير متوقعة. لجميع خوارزميات التعلم الآلي نقطة ضعف؛ فمعرفة أن السمات أساسية للتعرف على الصور- أي معرفة القليل عن الخوارزمية – يجعل من الممكن تعديل الصور لإعاقة عملية صنع القرار في الجهاز أو حتى إجباره على ارتكاب خطأ.
تتمثل حداثة النهج المثبت في مؤتمر RSA 2021 في أن الطيار الآلي قد عُرض عليه صور غير معدلة – لا يحتاج المهاجم إلى معرفة كيفية عمل الخوارزمية أو السمات التي تستخدمها. تم عرض الصور لفترة وجيزة على الطريق والأشياء الثابتة القريبة، مع النتائج التالية:
في شكل مختلف عن الموضوع، ظهرت الصور لجزء من الثانية في إعلان تجاري على لوحة إعلانات على جانب الطريق، مع النتيجة نفسها بشكل أساسي:
https://www.youtube.com/watch?v=-E0t_s6bT_4
ومن ثم، خلص مؤلفو الدراسة إلى أن مجرمي الإنترنت يمكن أن يتسببوا في إحداث فوضى من مسافة آمنة، مع عدم وجود خطر من ترك الأدلة في مسرح الجريمة. كل ما يحتاجون إلى معرفته هو المدة التي يتعين عليهم خلالها عرض الصورة لخداع الذكاء الاصطناعي (للسيارات ذاتية القيادة حد لتقليل احتمالية إنتاج نتائج إيجابيات كاذبة، على سبيل المثال، أوساخ أو حطام على عدسة الكاميرا أو الليدار).
الآن، تُقاس مسافة فرملة السيارة بعشرات الأقدام، لذا فإن إضافة بضعة أقدام للسماح بتقييم أفضل للوضع لم تكن بالأمر المهم بالنسبة إلى مطوري الذكاء الاصطناعي.
وقت رد فعل أنظمة التعرف على تسلا وموبيلي على صورة وهمية
طول الفترة الزمنية اللازمة لإظهار صورة وهمية لأنظمة التعرف على تسلا وموبيلي.
ومع ذلك، فإن رقم مجموعة من الأمتار ينطبق على نظام الرؤية الاصطناعية موبيلي وسرعة 60 كم / الساعة (حوالي 37 ميلاً في الساعة). في هذه الحالة، يكون وقت الاستجابة حوالي 125 مللي ثانية. حد استجابة الطيار الآلي لـتسلا، كما حددها الباحثون تجريبيًا، يبلغ تقريبًا ثلاثة أضعاف، عند 400 مللي ثانية. وبالسرعة نفسها، سيضيف ذلك ما يقرب من 7 أمتار (حوالي 22 قدمًا). في كلتا الحالتين، لا يزال جزء من الثانية. ومن ثم، يعتقد الباحثون أن مثل هذا الهجوم قد يأتي من فراغ – قبل أن تعرف ذلك، فأنت في حفرة واختفت الطائرة الآلية التي تعرض الصورة.
تبعث إحدى الخصائص في النظام الأمل في أن يتمكن الطيار الآلي في النهاية من صد هذا النوع من الهجوم: الصور المعروضة على أسطح غير مناسبة لعرض الصور مختلفة تمامًا عن الواقع. يجعل تشوه المنظور والحواف غير المستوية والألوان غير الطبيعية والتباين الشديد وغيرها من أوجه الشذوذ من السهل جدًا على العين البشرية تمييزها عن الأشياء الحقيقية.
على هذا النحو، فإن ضعف الطيار الآلي أمام الهجمات الوهمية هو نتيجة فجوة الإدراك بين الذكاء الاصطناعي والدماغ البشري. للتغلب على الفجوة، يقترح مؤلفو الدراسة تركيب أنظمة الطيار الآلي للسيارة مع إجراء فحوصات إضافية تتسق مع ميزات مثل المنظور ونعومة الحافة واللون والتباين والسطوع والتأكد من أن النتائج متسقة قبل اتخاذ أي قرار. مثل هيئة المحلفين البشرية، ستناقش الشبكات العصبية المعلمات التي تساعد على تمييز إشارات الكاميرا الحقيقية أو الليدار عن المكون الوهمي العابر.
سيؤدي القيام بذلك، بالطبع، إلى زيادة العبء الحسابي للأنظمة ويؤدي بشكل فعال إلى التشغيل المتوازي للعديد من الشبكات العصبية في وقت واحد، وكلها بالضرورة مهذبة (عملية طويلة وكثيفة الطاقة). وسيتعين على السيارات، وهي بالفعل مجموعات صغيرة من حواسيب على عجلات، أن تتحول إلى مجموعات صغيرة من الحواسيب العملاقة على عجلات.
مع انتشار مسرعات الذكاء الاصطناعي، قد تتمكن السيارات من حمل العديد من الشبكات العصبية، والعمل بالتوازي مع عدم استنزاف الطاقة على متنها. لكن هذه قصة ليوم آخر.