للعثور على رجل (نزيه)، اشتهر ديوجانس باستخدام مصباح، حيث اعتمد الفيلسوف فقط على طرق التعرف الضوئي. ومع ذلك، يقترح العلماء اليوم استخدام إشارات Wi-Fi لهذا الغرض. وبشكل أكثر تحديدًا، تستخدم الطريقة التي طورها ثلاثة باحثين في جامعة كارنيجي ميلون الإشارة من جهاز توجيه Wi-Fi منزلي عادي ليس فقط لتحديد موقع الشخص في الغرفة، لكن أيضًا لتحديد وضعيته.
لماذا شبكة Wi-Fi؟ هناك عدة أسباب لذلك. أولاً، على عكس التعرف الضوئي، تعمل إشارات الراديو بشكل مثالي في الظلام ولا تعوقها عوائق صغيرة مثل الأثاث. ثانيًا، هذا الحل رخيص الثمن، وهو ما لا ينطبق على أجهزة الليدار والرادارات، وهي أدوات أخرى يمكنها تنفيذ هذه المهمة. ثالثًا، أصبحت شبكة Wi-Fi موجودة في كل مكان بالفعل – ما عليك سوى الوصول إليها والاستيلاء عليها. لكن ما مدى فعالية هذه الطريقة؟ وماذا يمكنك أن تفعل بها؟ لنتعمق في هذا الموضوع.
DensePose: طريقة للتعرف على وضعيات الإنسان في الصور
مع ذلك، لكي نبدأ، نحتاج إلى العودة إلى الخلف قليلاً – أولاً، نحتاج إلى فهم كيفية التعرف بدقة على جسم الإنسان ووضعياته بشكل عام. في عام 2018، قدمت مجموعة أخرى من العلماء طريقة تسمى DensePose. واستخدموها بنجاح للتعرف على وضعيات الإنسان في الصور الفوتوغرافية، أي صور ثنائية الأبعاد بدون بيانات إضافية للعمق.
إليك طريقة عمله: أولاً، يبحث نموذج DensePose عن الكائنات الموجودة في الصور التي يتم التعرف عليها كأجسام بشرية. بعد ذلك، يتم تقسيم هذه الكائنات إلى مناطق مختلفة، حيث يتوافق كل منها مع جزء معين من الجسم، ويتم تحليلها بشكل فردي. ويُستخدم هذا الأسلوب لأن أجزاء الجسم تتحرك بشكل مختلف تمامًا: على سبيل المثال، يتصرف الرأس والجذع بشكل مختلف تمامًا عن الذراعين والساقين.
نتيجة لذلك، تعلم النموذج ربط صورة ثنائية الأبعاد بالسطح ثلاثي الأبعاد لجسم الإنسان، ولم يحصل فقط على تعليقات توضيحية للصورة تتوافق مع الوضعية التي تم التعرف عليها، لكن أيضًا على خريطة الأشعة فوق البنفسجية للجسم الموضح في الصورة. وهذا الأخير يجعل من الممكن، على سبيل المثال، تراكب مادة على الصورة.
الأكثر إثارة للإعجاب هو أن هذه التكنولوجيا يمكنها التعرف بدقة على وضعيات العديد من الأشخاص في الصور الجماعية، حتى تلك الصور الفوضوية “لحفلة التخرج” حيث يتجمع الأشخاص معًا ويحجبون بعضهم البعض جزئيًا.
علاوة على ذلك، إذا صدقنا الصور المعروضة في البحث ومقاطع الفيديو التي نشرها الباحثون، فإن النظام يمكنه التعامل بثقة حتى مع وضعيات الجسم الأكثر غرابة. على سبيل المثال، تحدد الشبكة العصبية بشكل صحيح الأشخاص الذين يركبون الدراجات والدراجات النارية والخيول، كما تحدد بدقة أيضًا وضعيات لاعبي البيسبول، ولاعبي كرة القدم، وحتى الراقصين، الذين غالبًا ما يتحركون بطرق غير متوقعة.
هناك ميزة أخرى لنموذج DensePose هي أنه لا يتطلب قوة حاسوبية غير عادية للعمل. وباستخدام بطاقة GeForce GTX 1080 – وهي بالكاد بطاقة رسومات من الطراز الأول، حتى في وقت نشر الدراسة – يلتقط نموذج DensePose معدل 20-26 إطارًا في الثانية بدقة 240×320 وما يصل إلى خمسة إطارات في الثانية عند دقة 800×1100.
DensePose عبر شبكة Wi-Fi: موجات الراديو بدلاً من الصور
في الأساس، كانت فكرة الباحثين في جامعة كارنيجي ميلون هي استخدام نموذج الذكاء الاصطناعي الحالي عالي الأداء للتعرف على الجسم، DensePose، لكن مع تغذيته بإشارات Wi-Fi بدلاً من الصور الفوتوغرافية.
لإجراء تجربتهم، قاموا ببناء الإعداد التالي:
- حاملان مزودان بأجهزة توجيه منزلية قياسية من TP-Link، كل منهما مزود بثلاثة هوائيات: يعمل أحدهما كجهاز إرسال والآخر كجهاز استقبال.
- مشهد التعرف الموضوع بين هذين الحاملين.
- كاميرا مثبتة على حامل بجوار جهاز التوجيه، تلتقط المشهد نفسه الذي كان الباحثون يهدفون إلى التعرف عليه باستخدام إشارات Wi-Fi.
بعد ذلك، قاموا بتشغيل DensePose، الذي حدد وضعيات الجسم باستخدام الكاميرا المثبتة بجوار جهاز التوجيه المتلقي، وكلفوه بتدريب شبكة عصبية أخرى عملت مع إشارة Wi-Fi من جهاز التوجيه المتلقي. وتمت معالجة هذه الإشارة مسبقًا وتعديلها للتعرف عليها بشكل أكثر موثوقية، لكن هذه تفاصيل بسيطة. وكانت النقطة المهمة هي أن الباحثين تمكنوا بالفعل من إنشاء نموذج Wi-Fi-DensePose جديد يعيد بناء المواقع المكانية للأجسام البشرية بدقة باستخدام إشارات Wi-Fi.
قيود هذه الطريقة
مع ذلك، دعونا لا نتعجل في كتابة عناوين مثل “العلماء يتعلمون الرؤية عبر الجدران باستخدام شبكة Wi-Fi” حتى الآن. وبادئ ذي بدء، “الرؤية” هنا مجردة تمامًا – فالنموذج لا “يرى” جسم الإنسان في الواقع، لكن يمكنه التنبؤ بموقعه وبالوضعية باحتمالية معينة بناءً على بيانات غير مباشرة.
ويعد تصور أي شيء بتفاصيل معقدة باستخدام إشارات Wi-Fi تحديًا معقدًا. وتم إثبات ذلك من خلال دراسة أخرى مماثلة، حيث جرب الباحثون أشياء أبسط بكثير من الأجسام البشرية – وكانت النتائج، بعبارة ملطفة، بعيدة عن المثالية.
من المهم أيضًا ملاحظة أن النموذج الذي صممه باحثو جامعة كارنيجي ميلون أقل دقة بكثير من الطريقة الأصلية للتعرف على الوضعيات في الصور الفوتوغرافية، كما أنه يُظهر أيضًا “هلوسة” خطيرة جدًا. ويواجه النموذج صعوبة خاصة في الوضعيات أو المشاهد غير العادية التي تتضمن أكثر من شخصين.
بالإضافة إلى ذلك، تم التحكم بدقة في شروط الاختبار في الدراسة: هندسة بسيطة ومحددة جيدًا، وخط رؤية واضح بين جهاز الإرسال وجهاز الاستقبال، والحد الأدنى من تداخل إشارات الراديو، حيث أعد الباحثون كل شيء حتى يتمكنوا من “اختراق” المشهد عن طريق موجات الراديو بسهولة. ومن غير المرجح أن يتكرر هذا السيناريو المثالي في العالم الحقيقي.
لذا، إذا كنت قلقًا من أن يخترق شخص جهاز توجيه Wi-Fi الخاص بك ويراقب ما تفعله في المنزل، فلا تقلق. وإذا كان هناك أي شيء يدعو للقلق في منزلك، فهو الأجهزة المنزلية. على سبيل المثال، تحتوي أجهزة تغذية الحيوانات الأليفة الذكية أو حتى ألعاب الأطفال على كاميرات وميكروفونات واتصال سحابي، في حين تحتوي المكانس الكهربائية الروبوتية على أجهزة ليدار تعمل بشكل لا تشوبه شائبة في الظلام، فضلاً عن القدرة على التحرك.
وفي الخارج، ينتظرك جاسوس آخر – ذو أربع عجلات. ومن حيث كمية المعلومات التي تجمعها، تتفوق السيارات اليوم بأميال على الساعات الذكية، ومكبرات الصوت الذكية، وغيرها من الأدوات اليومية.