手势追踪被视为人机交互(HCI)/人类数据交互(Human data interaction,HDI)中最直观的交互模式之一,是混合现实(XR)终端交互的最新趋势。
在XR领域中,手部运动轨迹的感知与追踪是改善用户在不同技术领域和平台体验的一个重要组成部分。手部追踪技术在未来可以帮助用户“解放双手”,人机互动不再需要通过手柄控制,实现真正的解放双手,让用户以最直观的方式体验在增强现实和物理世界之间的融合。
最近热度不断攀升的Oculus Quest 2一体机,在手势追踪识别功能上进行了一系列升级,除了早期的特定手势操控主界面,最新解决方案甚至实现了基于手部追踪的全文本输入操作——即便如此,Oculus对于目前在手势识别技术上取得的成就依然不是非常满意。
Oculus曾表示,尽管手势是一种有潜力的新型输入方式,但由于计算机视觉与定位技术的局限,手势识别技术的实际应用场景也受到限制。因此,Oculus一直在探索一些有用的技巧来帮助开发者适应手势的局限性,甚至为了让虚拟世界更具3D效果、更加智能地对手势进行回应,Oculus已收购两家虚拟现实手势和3D技术的创业型公司 Nimble VR和13th Lab,以改善其一体机的手势控制功能。
目前,由于涉及复杂的手指手掌结构和相关软组织在运动时的变化,以及手和物体之间的接触互动有着非常复杂的接触点位和运动区域,强大的实时手部运动感知和追踪已成为公认的一项极具挑战性的计算机视觉任务,是科技研究领域中的大热项目。
数据堂自制版权的系列数据集产品为“手势识别”这一技术路径的实现提供了强有力的支持。
1314,178张18种手势识别数据
314,178张18种手势识别数据涵盖多种场景、18种手势、5种拍摄角度、多年龄段、多种光照条件。在标注方面,标注21关键点(每个关键点有可见不可见属性)、手势类别和手势属性。314,178张18种手势识别数据可用于手势识别、人机交互等任务。
手势交互应用的难点主要在于难以形成一致的手部操作方式,加上其属于非精确性指令操作,其应用范围会受交互设备、识别方法、用户熟练程度等多个因素影响。由于不同用户对不同产品使用手势交互时,其手部运动轨迹也大相径庭,所以用户可能需要预先训练一段时间去掌握相关设备或者系统,一定程度上是用户要满足机器的模版识别度。但ContactPose包括着不同人群抓握不同物体时的数据集,这意味着,日后随着数据采集的规模化,机器可以开始轻松识别不同的手势运动轨迹,从而实现机器识别的个性化、灵活性。
纵观Oculus或者HoloLens这些行业领头羊的设备,在用户使用时,很多时候由于对手势识别的不敏感或者错误偏差,使得用户不得不依赖于手柄操作和语音控制来完成对虚拟现实设备界面的指令,手势交互的人机操控方式在技术上显然不够成熟,尚且还处在行业早期阶段。