عند تناول موضوع الروبوتات الشبيهة بالبشر، يتضح أن حركة الشفاه المتزامنة مع الكلمات تعد من العناصر الأساسية لتحقيق الواقعية، حيث يبرز الروبوت الجديد كأداة لا تقتصر على محاكاة هذه الحركة فحسب بل يمتلك القدرة على تدريب نفسه للتحدث بطريقة تحاكي البشر، مستفيدًا من تقنيات التعلم المتقدمة التي تركز على الربط بين الصوت والحركة.

روبوت يتعلم حركة الشفاة
روبوت يتعلم حركة الشفاة

تصميم روبوت EMO

طور طالب الدكتوراه في علم الروبوتات يوهانغ هو، بالتعاون مع البروفيسور هود ليبسون وفريق من جامعة كولومبيا، روبوت EMO، وهو رأس روبوتي مزود بـ 26 محركًا صغيرًا أسفل جلد مرن مصنوع من السيليكون، حيث تعمل هذه المحركات بتوليفات مختلفة لإنتاج تعابير وجه متعددة، بما في ذلك أشكال متنوعة لحركة الشفاه، بحسب newatlas.

التعلم عبر المراقبة والتجربة

بدأ الباحثون بتدريب الروبوت عبر وضعه أمام مرآة، حيث راقب نفسه أثناء تنفيذ آلاف التعابير الوجهية العشوائية، مما مكنه من فهم العلاقة بين تنشيط المحركات والحركات الوجهية الناتجة، من خلال نموذج تعلم يعرف باسم من الرؤية إلى الفعل VLA، لاحقًا، شاهد الروبوت ساعات طويلة من مقاطع فيديو لأشخاص يتحدثون ويغنون، ليتعلم حركات الفم المرتبطة بالأصوات المختلفة.

آفاق التطوير والتفاعل

رغم أن التقنية لا تزال تواجه صعوبات في نطق بعض الأصوات مثل ب و و، فإن الباحثين يتوقعون تحسن الأداء مع مزيد من التدريب، وأوضح يوهانغ هو أن دمج مزامنة حركة الشفاه مع أنظمة ذكاء اصطناعي تفاعلية مثل شات جى بى تى أو جيميناى يمكن أن يعزز العلاقة بين الروبوت والإنسان، ويجعل التعابير الوجهية أكثر دقة وحساسية لسياق المحادثة.