إذا قالت صديقتك أنّها تشعر بالرّاحة، لكنّك تراها في حالة تشنُّجٍ، قد يجعلك هذا تشكّ في صدقها. أمّا الروبوتات، فهي على النّقيض قد تأخذ كلامها على محمل الجدّ.
تقول لغة الجسد الكثير، لكن حتّى مع التّقدّم في مجال الرّؤية الحاسوبيّة (Computer vision) وتقنيّة التّعرُّف على الوجه، تصعب على الرّوبوتات ملاحظة حركة الجسم الدّقيقة. ولهذا قد تفوتها إشارات تواصلٍ اجتماعيّةٌ مهمّةٌ.
طوّر الباحثون في جامعة كارنجي ميلون (Carnegi Mellon) نظامًا تتبُّعيًّا للجسم قد يساعد في حلّ هذه المشكلة يُدعى أوبِن بوز (OpenPose). يمكن لهذا النّظام تتبُّع حركة الجسم آنيًّا (في الوقت الحقيقيّ)، بما في ذلك اليدين والوجه. تستخدم هذه الروبوتات الرّؤية الحاسوبيّة وتعلُّم الآلة لمعالجة إطارات الفيديو، ويمكنها أيضًا تتبُّع العديد من الأشخاص في الوقت نفسه. وبالتّالي تُسهّل هذه الإمكانيّة التّفاعلات بين الإنسان والرّوبوت، وتمهّد الطّريق لواقعٍ افتراضيٍّ معزّزٍ وأكثر تفاعُلًا بالإضافة إلى واجهات مستخدمٍ حدسيّةٍ.
مرحلة تعلم الروبوتات
تكمن إحدى الميزات البارزة لنظام أوبن بوز في أنّه لا يقتصر على تتبُّع رأس الشّخص وجذعه وأطرافه فحسب، بل يمكنه أيضًا تتبُّع أصابعه بشكلٍ فرديٍّ، وللقيام بذلك استخدم الباحثون نظامًا يُدعى ستوديو بان أوبتِك (Panoptic Studio) تابعًا للجامعة، وهو عبارةٌ عن قبّةٍ بها (500) كاميرا، حيثُ التقطوا أوضاع الجسم في زوايا متنوّعةٍ، ثمّ استخدموا تلك الصّور لبناء مجموعةٍ من البيانات. ثمّ قاموا بتمرير تلك الصّور من خلال ما يُسمّى كاشف النّقاط الرّئيسيّة (keypoint detector) لتحديد وتسمية أجزاءٍ معيّنةٍ من الجسم. يتعلّم البرنامج أيضًا ربط أجزاء الجسم بالأطراف؛ لذلك يعرف مثلًا أنّ يد شخصٍ معيّنٍ ستكون دائمًا قريبةً من مرفقه، هذا يجعل من الممكن تتبّع عدّة أشخاصٍ في وقتٍ واحدٍ.
التُقطت الصّور من القبّة بالنّظام ثنائيّ الأبعاد (2D)، لكن أخذ الباحثون هذه النّقاط الرّئيسيّة وقاموا بتثليثها إلى النّظام ثلاثيّ الأبعاد (3D)؛ لمساعدة خوارزميّات تتبُّع الجسم الخاصّة بهم على فَهم كيفيّة ظهور كلّ وضعٍ من النّواحي المختلفة. وبمعالجة كلّ هذه البيانات، يمكن للنّظام تحديد شكل اليد بأكملها عندما تكون في وضعٍ معيّنٍ، حتّى لو كانت الأصابع محجوبةً.
مرحلة التشغيل
الآن يمكن تشغيل النّظام بكاميرا واحدةٍ فقط أو جهاز كمبيوتر محمولٍ بعد أن أصبحت لدى النّظام مجموعةٌ من البيانات المستوحاة، كذلك لم يعد يتطلّب القبّة لتحديد أوضاع الجسم؛ ممّا جعل هذه التّكنولوجيا قابلةً للتّنقّل وسهلة المنال. وهي أيضًا مفتوحة المصدر، فقد أصدر الباحثون بالفعل الكود الخاصّ بهم للعامّة؛ لتشجيع التّجريب.
ما يمكن أن تفعله هذه التكنولوجيا
يقول الباحثون إنّ هذه التّكنولوجيا من الممكن تطبيقها على جميع أنواع التّفاعلات بين البشر والآلات، كذلك يمكن أن تلعب دورًا كبيرًا في تجارب الواقع الافتراضيّ (VR)، ممّا يسمح باكتشاف حركة المستخدم الجسديّة دون أيّة أجهزةٍ إضافيّةٍ، مثل أجهزة المستشعرات اللّاصقة (stick-on sensors) أو القفّازات.
يمكن أيضًا أن تسهّل التّعاملات الطّبيعيّة مع الروبوتات المنزليّة، كأن تقول لروبوتك طالبًا: «التقط هذا»، فيفهم ما تُشير إليه على الفور. قد يتعلّم الرّوبوت حتّى قراءة المشاعر من خلال إدراك وتفسير إيماءاتك الجسديّة وتتبُّع لغة الجسد. فلا تقلق من المستقبل، فحتّى إن فقدْتَ وظيفتك لروبوتٍ، ستجد آخر يحنو عليك ويتفهّم حزنك. ولربّما يقدّم إليك منديلًا لتجفّف دموعك حينها!