منذ وقت ليس ببعيد، كتبنا عن الأساليب التي ابتكرها مردخاي غوري وزملاؤه في جامعة بن غوريون لاستخراج المعلومات من جهاز غير متصل بالإنترنت فحسب، بل أيضًا معزول فعليًا عن الشبكة. وفي مؤتمر Black Hat المنعقد في الولايات المتحدة الأمريكية عام 2020، قدم باحث آخر من جامعة بن غوريون تقريرًا عن موضوع متعلق بذلك. وتحدث بن ناسي حول طريقة التنصت البصرية التي يطلق عليها هو وزملاؤه Lamphone
سوف نتحدث عن كيفية عمل Lamphone أدناه، ولكن دعونا نبدأ باستطراد قصير في تاريخ هذه القضية.
كيف يمكننا رؤية الصوت؟
إحدى التقنيات المعروفة لتسجيل الصوت عن بُعد باستخدام ما يسمى الطرق البصرية هو ميكروفون الليزر. وهي تقنية سهلة للغاية.
حيث يوجه الأشخاص المتنصتون على محادثة شعاع ليزر يعمل في نطاق الأشعة تحت الحمراء (أي غير المرئية للعين البشرية) على سطح مناسب (عادةً شباك زجاجي) في الغرفة التي تدور فيها المحادثة. ينعكس الشعاع على السطح ويصطدم بجهاز الاستقبال. وتنشئ الموجات الصوتية اهتزازات على سطح الجسم الذي يحوِّل سلوك شعاع الليزر المنعكِس. ويسجل جهاز الاستقبال التغييرات التي يتم تحويلها بالنهاية إلى تسجيل صوتي للمحادثة.
كانت هذه التكنولوجيا مستخدمة منذ حقبة الحرب الباردة وظهرت في كثير من أفلام الجاسوسية. ربما رأيتموها في أحد الأفلام. وتنتج العديد من الشركات أجهزة جاهزة للاستخدام لاستخدامها في التنصت بالليزر ويمتد نطاق تشغيلها حتى 500 أو 1000 متر. وعلى الرغم من ذلك فهناك خبران جيدان لهؤلاء القلقين من أن يكونوا هدفًا للتنصت بالليزر: أولاً ميكروفونات الليزر غالية جدًا؛ وثانيًا، لا يبيع المصنِّعون ميكروفونات الليزر إلا للوكالات الحكومية (أو هكذا يزعمون).
ومع ذلك فإنه وفقًا لناسي، فإن الطبيعة النشطة لميكرفونات الليزر تعتبر عيبًا خطيرًا. فحتى يعمل هذا النوع من التنصت تحتاج إلى “إضاءة” أحد الأسطح بشعاع ليزر، وهذا يعني أنه يمكن لجهاز الكشف عن الأشعة تحت الحمراء اكتشافه.
وقبل عدة سنوات، قدَّمت مجموعة من الباحثين في معهد ماساتشوستس للتكنولوجيا طريقة بديلة “للتسجيل البصري” وكانت كامنة تمامًا. كانت فكرتهم هي تلك الفكرة نفسها إلى حد كبير: تنشئ الموجات الصوتية اهتزازات على سطح أحد الأجسام. ويمكن بالطبع تسجيل الاهتزازات.
ولتسجيل الاهتزازات، استخدم الباحثون كاميرا عالية السرعة بعدة آلاف من الإطارات في الثانية. وبمقارنة الإطارات من الكاميرا (بمساعدة الكمبيوتر)، تمكنوا من نسخ الصوت من تسلسل إطارات الفيديو.
ومع ذلك كان لهذه الطريقة عيب كبير أيضًا. حيث كانت الموارد الحاسوبية المطلوبة لتحويل كمية المعلومات البصرية الضخمة من الكاميرا عالية السرعة إلى صوت موارد هائلة. حتى مع استخدام محطة عمل قوية للغاية، احتاج باحثو معهد ماساتشوستس للتكنولوجيا إلى 2-3 ساعات لتحليل فيديو مسجَّل مدته 5 ثوانٍ، لذلك من الواضح أن هذا النهج ليس جيدًا لالتقاط المحادثات فوريًا.
كيف يعمل Lamphone
قدَّم ناسي وزملاؤه تقنية “التنصت البصري” التي أطلقوا عليها اسم Lamphone. الفكرة الرئيسية لهذه الطريقة هي استخدام المصباح (ومن هنا جاءت اسم التقنية) كجسم يمكنك من خلاله التقاط الاهتزازات الناتجة عن الصوت.
فليس المصباح جسمًا عاديًا للغاية فحسب، بل إنه ساطع أيضًا. لذلك لا يحتاج الشخص الذي يستخدم اهتزازات المصباح لإهدار الموارد الحاسوبية على تحليل التغيرات الدقيقة للغاية في الصورة. وكل ما عليه فعله هو توجيه تلسكوب قوي على المصباح. ويوجِّه التلسكوب التدفق الضوئي من المصباح إلى مستشعر كهربائي -بصري.
لا يبعث المصباح الضوء في اتجاهات مختلفة بانتظام بصورة مثالية (فمن المثير للاهتمام أن التفاوت يختلف عبر الأنواع المختلفة من المصابيح، حيث يكون عاليًا مع المصابيح المتوهجة ومصابيح LED، ولكنه أقل بكثير مع المصابيح الفلورية). ويتسبب هذا التفاوت (التي تسببه الموجات الصوتية) في جعل اهتزازات المصباح تغير كثافة تدفق الضوء الذي يلتقطه المستشعر الكهربائي-البصري بصورة طفيفة. وهذه التغييرات ملموسة بما فيه الكفاية ليتم تسجيلها. وبعد تسجيل التغييرات وإجراء عدد من التحويلات البسيطة، تمكن الباحثون من استعادة الصوت الناتج من “التسجيل الضوئي”.
ولاختبار طريقتهم، أقدم الباحثون على تركيب جهاز تنصت على جسر للمشاة على بعد 25 مترًا من نافذة غرفة الاختبار، حيث جرى تشغيل الصوت من خلال مكبر الصوت. ومن خلال توجيه تلسكوب إلى مصباح في الغرفة، تمكن الباحثون من تسجيل تغيرات الضوء وتحويلها إلى تسجيل صوتي.
وكانت التسجيلات الناتجة مفهومة تمامًا. على سبيل المثال تمكن تطبيق Shazam من التعرف على أغنيتي الاختبار “Let It Be” لبيتلز و”Clocks” لكولدبلاي، وتمكنت خدمة التعرف على الكلام من Google من نسخ كلمات دونالد ترامب التي ألقاها في أحد خطابات حملته بصورة صحيحة.
هل يمثل Lamphone تهديدًا فعليًا؟
نجح ناسي وزملاؤه في تطوير طريقة وظيفية حقيقية “للتنصت البصري”. والأهم من ذلك، أن الطريقة كامنة تمامًا وبالتالي لا يمكن تسجيلها بواسطة أي جهاز كاشف.
ولاحظ أيضًا أنه على عكس الطريقة التي يتبعها الباحثون في معهد ماساتشوستس للتكنولوجيا، فإن الحسابات الخاصة بفك ترميز تسجيلات Lamphone بسيطة للغاية. لأن المعالجة لا تتطلب موارد حاسوبية ضخمة، يمكن استخدام Lamphone في الوقت الفعلي.
ومع ذلك، يعترف ناسي أنه خلال التجربة جرى تشغيل الصوت في غرفة الاختبار بصوت مرتفع للغاية. ولذلك، فإنه قد تكون نتائج التجربة ذات أهمية نظرية في المقام الأول. ومن ناحية أخرى، ينبغي ألا نقلل من بساطة الأساليب المستخدمة لتحويل “تسجيل ضوئي” إلى صوت. وقد تُحسَّن هذه التقنية بصورة أكبر باستخدام خوارزميات التعلم الآلي على سبيل المثال، التي تتفوق في مثل هذه الأنواع من المهام.
وفي هذه المرحلة يقيِّم الباحثون الجدوى الحالية لتطبيق هذه التقنيات عمليًا، حيث إنها ليست صعبة للغاية ولا سهلة للغاية، لكنها بين هذا وذلك. ومع ذلك، فإنهم يتوقعون أنه قد تصبح الطريقة عملية أكثر – إذا كان بإمكان شخص ما تطبيق خوارزميات متطورة لتحويل قراءات أجهزة الاستشعار الكهربائية-البصرية إلى تسجيلات صوتية.