当前,VR手柄控制器是与VR眼镜配套使用的外设设备。VR眼镜通过手柄识别用户的手部位姿,用户通过手柄上的按键和摇杆等与虚拟世界互动,从而实现更真实沉浸的交互体验。随着VR眼镜在C端的铺开,VR手柄发展得相对成熟且被广泛接受,市场期望其能提供精准和流畅体验的同时变得更轻便。
Meta在给Quest 3配套的Touch Plus手柄的体积和重量都相较Quest 2的配套手柄做了裁切。但Quest 3发布后不久,Meta社区论坛上出现不少用户吐槽Quest 3 手柄T的追踪性能比 Quest 2差得多。
国外玩家对比Quest 3 VS Quest Pro手柄
昵称为NotDream的用户称,使用Quest 3在《Gorilla Tag》游戏内进行投球或接球等快速运动场景时会丢失手柄追踪。其他用户也纷纷发表“怨言”,他们在其他如《Beat Saber》、《Tennis Esports》等VR游戏中也遇到了同样的问题。
对此,《Eleven Table Tennis》的游戏开发者carrotstien认为问题源于手柄控制器上的LED阵列排布的改变(取消了追踪光环)。他表示:“我多么希望体育游戏开发者能被邀请到讨论手柄设计的谈判桌上。当前手柄追踪的问题甚至导致部分消费者放弃购买Quest 3,选择继续使用Quest 2。”
Meta在Connect 2023上曾提到,其将红外 LED 从追踪环移至手柄的操作面板中,他们同时还在手柄底部添加了单个红外 LED。这些用于追踪的标记会有被遮挡的可能而影响追踪效果,但 Meta 相信其改进的算法能够应对追踪Touch Plus 以及 Quest 2 手柄的挑战。
相信很多人都会有这个疑问,取消追踪光环,这么做真的好吗?
手柄追踪方案发展
VR手柄定位方案经历了很长一段时间的探索期,前期有超声波、激光、电磁、可见光等五花八门的方案,到如今基于红外光环式追踪方案成为了主流。
红外光环式追踪
红外光环式追踪方案依赖手柄上一个显著突出的物理结构,即追踪光环,来确保手柄在各种各样的握持角度和位置条件下,都有足够的LED灯点可以被头显的定位摄像头捕获到。多个LED光点在图像上的2D位置被确定后,就可以进行位姿PNP解算。
如果是纯视觉定位的话,其缺点在于对于环境要求较高,并且当手柄移动到捕捉范围外时非常容易丢失,所以需要靠算法进行补偿。
而视觉追踪+惯性传感两者混合,当手柄位于摄像头追踪范围外时,辅以手柄内高帧率的IMU惯性信息,则可以获得精确的手柄高频定位结果,进而为用户提供更加准确、流畅的追踪体验。该方案不像电磁定位或者超声波定位那样需要依靠专门的传感器模组,具有精度高、低成本、低功耗等优势。
为了尽可能地增加光环被头显摄像头捕捉的面积,手柄体积往往较大,重量较重,不便于携带的,在某些情况下会出现左右手柄彼此碰撞,且长时间使用也可能会让用户产生疲劳。
VR设备的轻量化和小型化,一直是XR行业探索和努力的方向,自追逐手柄和无光环手柄便是手柄小型化探索道路上的两颗明珠。
自追踪
Quest Pro的发布让手柄自追踪技术来到台前,以往头显的手柄需要依靠头显上的摄像头来进行追踪,由于容易出现视觉定位遮挡或者光线影响导致手柄漂移、丢失等不稳定情况,所以在视觉之外往往都会配合IMU来进行补偿计算。
所谓自追踪手柄,指的是手柄通过内置的摄像头传感器等组件,可在脱离头显本体的情况下实现定位追踪。自追踪一方面为了提升追踪范围,同时也承载着为用户带来更好的使用体验的设计初衷。
尽管有许多优点,但欢创科技周琨却认为它并不会成为发展的主流,主要还是成本问题。
Touch Pro里面配备了高通骁龙662、3颗VGA摄像头、2个Z轴线性马达、1个X轴线性马达以及若干射频/传感模块,一对手柄售价达到了299美元。
“如果把自追踪手柄所带来的收益和它的成本代价相比较,我觉得收益会小于它的代价。它所带来的收益无非是体积变小了以及盲区缩小了。对于盲区问题,目前红外手柄做得也不错,没有很多场景会感觉到局限。“周琨说到。
无光环
23年META在Quest 3 上对手柄进行了大更新, 将光环上的LED放置于面板和底部,命为Touch Plus。似乎在价格不菲的自追踪Touch Pro和带光环Touch之间找到了平衡点。
无独有偶,9月21日PICO也展示了最新的无光环手柄设计。
PICO新手柄去掉了外围灯环的设计,并且没有额外增加传感器。据PICO官方透露,相比上一代手柄,新手柄重量减轻了约15g,高度减小了50%。
通常来说,去掉包含LED灯的追踪灯环,可追踪的LED光点减少,甚至在遮挡的情况下无法捕捉到光点,那么只依靠IMU,势必会降低手柄的追踪精度和稳定性。此时,用户能够依赖的只有自己的双手,因此需要将手势识别融合进去。
主流大厂均倾向于多模态追踪,即融合光学追踪算法和CV手势追踪的方案来保证定位的准确性。
这样头显既能通过光学追踪算法识别手柄面板上LED灯发出的红外光,还能够在LED灯被手部遮挡时,通过CV模态追踪算法识别裸手的特征,从而准确还原出手柄控制器的6DoF信息。让手柄在LED灯减少或处于盲区的背景下,也能实时、有效追踪。
图片来源:Mashable
然而,裸手追踪自身也面临诸多挑战。例如,裸手追踪需要高精度和低延迟,以便能够实时准确地捕捉用户的动作。此外,光照条件、背景干扰、用户的手部形状和颜色差异等因素也可能影响裸手追踪的表现。
值得注意的是,因为手持手柄,裸手的可识别特征相对来说不太明显,如何在这种情况下做到准确的手势识别并实时估算手柄和手掌的相对位置关系,便是首要攻克的难题。
PICO的裸手团队给出了Down-Top 的端到端 6DoF 追踪算法,通过有效利用多目时序的全局上下文信息,比如身体的骨骼信息以及结合时间顺序判断,一次性准确且稳定地预测手部位姿,能够在手柄追踪失效时,及时提供鲁棒的位姿。
Top-Down 和 Down-Top是对象检测识别任务重的的两种常见策略。前者通常从全局或更大尺度的视角开始,逐渐向更精细的细节进行;后者则从小尺度的细节开始,逐渐构建出全局的视图。
PICO 采用的Down-Top 方案,能够在精度相近的情况下,提高手柄的检出率,从原先的 36% 提升到了93%。从下图中看,右侧 Down-Top 图中连贯的绿线即表示系统有在持续并且稳定地追踪。
裸手和手柄的位姿之间的桥梁是如何建立的呢?
一般采用来基于高精度动作捕捉系统完成了数据采集和标注。PICO 数据交互团队表示:
“为了生产高精数据,我们在小手柄裸手姿态数据的高精标注任务中,一方面采用了自研的业内领先的基于相机阵列的多视角手部姿态标注技术方案;另一方面针对该特定任务进行了预重建,进一步提升了手部姿态数据的精度。在数据生产上也提供了多套技术方案,如相机阵列的真实采集与仿真合成平台方案,多种方案结合,有力保障 AI 训练数据的支撑。”
高精度数据采集与自动标注流程
小结
作为可穿戴设备配件,手柄控制器终归向着越来越轻便和无感的趋势靠近。随着Meta、PICO等大厂逐步完善相关技术布局,无光环手柄正在成为下一代VR手柄交互的主流方案,但追踪精度仍然应该是首要关注点,很多问题仍亟待解决。