← 返回首页

Ruka-v2:用于机器人学习的带腕部及外展功能的肌腱驱动开源灵巧手

arXiv: 2603.26660v1

论文信息

标题: Ruka-v2: Tendon Driven Open-Source Dexterous Hand with Wrist and Abduction for Robot Learning

作者: Xinqi, Liu, Ruoxi Hu, et al.

发布日期: 2026-03-27

arXiv ID: 2603.26660v1

PDF链接: 下载PDF

从灵巧到拟人:Ruka-v2开源灵巧手如何突破机器人学习的硬件瓶颈

在机器人学领域,赋予机器以媲美人类的灵巧操作能力,一直是研究者们孜孜以求的“圣杯”。然而,长期以来,一个巨大的障碍横亘在算法进步与物理实现之间:缺乏易于获取、功能强大且成本可控的灵巧机器人硬件。高性能的商业灵巧手,如Shadow Hand或Allegro Hand,往往价格昂贵且闭源,极大地限制了学术界和独立研究者在真实物理世界中探索复杂操作与学习算法的可能性。正是在这样的背景下,Ruka项目应运而生,旨在通过开源设计打破这一壁垒。去年发布的第一代Ruka手,以其低于1300美元的成本、11个自由度(DOF)的肌腱驱动设计和创新的数据驱动控制方法,成为了开源灵巧手领域的里程碑。然而,初代设计在追求极致拟人化方面仍存缺憾——它缺少了人类手腕的灵活转动能力以及手指的并拢/张开(内收/外展)自由度,而这些动作对于完成诸如在狭小空间内操作、抓握薄片物体或进行精细的笔触控制等任务至关重要。Ruka-v2的发布,正是为了填补这一关键空白,将一个更完整、更强大的拟人化操作平台推向社区,从而加速机器人学习,特别是涉及复杂接触与灵巧操作的强化学习研究。

核心架构:解耦式平行手腕与手指外展的工程实现

Ruka-v2的核心升级集中于两个关键的自由度扩展:一个2自由度的解耦平行手腕,以及为手指增加的外展/内收功能。这些设计选择背后蕴含着深刻的工程学与生物力学考量。

首先,让我们剖析其革命性的手腕设计。 人类手腕并非一个简单的单轴关节,它能够进行掌屈/背伸(上下摆动)和桡偏/尺偏(左右摆动)两种基本运动,且这两种运动在一定程度上是独立的。Ruka-v2采用了一种平行机构来实现这一2自由度运动。与串联机构(一个关节叠在另一个之上)相比,平行机构(如Delta机器人)通常具有更高的刚度、更快的动态响应和更紧凑的结构。在Ruka-v2中,两个独立的驱动单元( likely 通过肌腱)以平行的方式控制着手腕的两个旋转轴。这种“解耦”设计意味着控制其中一个方向(如掌屈)不会显著干扰另一个方向(如桡偏)的运动,从而实现了平滑、独立的双轴控制。这对于在像橱柜内部这样的受限环境中进行操作至关重要,机器人需要精确地调整手部姿态以避开障碍,同时执行抓取或推拉动作。

其次,手指的外展/内收功能是另一大亮点。 在人类手中,拇指与小指根部(掌指关节)具备使手指远离或靠近中指的能力,这被称为外展和内收。Ruka-v2为手指引入了这一自由度,其意义非凡。它使得机械手能够:

  1. 抓握薄型物体:如信用卡、纸张,通过手指的轻微张开形成稳定的夹持面。
  2. 实现掌内物体旋转:通过协调手指的外展/内收与弯曲/伸展,可以像人类一样在手掌内滚动或调整物体朝向,这是复杂操作(如工具使用)的基础。
  3. 执行精细的笔触控制:论文中甚至提到了“书法”应用,这凸显了该自由度对超高精度、可变接触力任务的支持潜力。

在技术实现上,Ruka-v2延续并优化了初代的肌腱驱动方案。肌腱驱动模仿了人类肌肉-肌腱系统,将电机(“肌肉”)放置在手臂或手掌基座等非指尖位置,通过柔性的线缆(“肌腱”)远距离传递力和运动。这样做的好处是极大地减轻了手指本体的重量和惯性,使得手指动作更快速、更精细,同时也更节能。然而,肌腱系统引入了非线性动力学,如摩擦、弹性形变和耦合效应。Ruka-v2继承了初代的数据驱动控制思想,通过在控制系统中建模这些肌腱动力学,来补偿非线性,实现更精准的关节位置或力矩控制。

创新贡献:开源生态与评估范式的双重推进

Ruka-v2的贡献远不止于增加了两个自由度。它在多个层面上推动了整个领域的发展。

首要且最根本的贡献是彻底的“开源硬核”。 项目网站(https://ruka-hand-v2.github.io/)毫不保留地提供了全套资源:3D打印文件、详尽的组装指南、控制器软件(包括与ROS的接口)以及演示视频。这意味着全球任何拥有3D打印机和基本机电组装能力的研究者、学生或爱好者,都能以相对低廉的成本(论文虽未明确v2价格,但预计仍远低于商业产品)构建出自己的高性能灵巧手。这极大地降低了机器人学习研究的入门门槛,促进了实验的可重复性和想法的快速迭代。

其次,它提出并实践了一套针对灵巧手性能的实用化评估体系。 论文没有停留在展示硬件功能,而是通过严谨的用户研究来量化其改进。研究者设计了需要手腕灵活性和手指外展能力的遥操作任务,让人类操作者分别使用Ruka和Ruka-v2来完成。结果令人信服:任务完成时间平均减少了51.3%,成功率提高了21.2%。这种以任务完成效率和效果为核心的评估方法,比单纯展示关节运动范围或抓握类型更有说服力,它直接证明了新增自由度对提升整体操作性能的实质性帮助。

最后,它清晰地展示了从硬件到学习算法的完整通路。 论文不仅进行了遥操作演示(包括单臂和双臂的13项灵巧任务),还进一步将其应用于自主策略学习。在3个任务上训练自主策略,证明了Ruka-v2作为一个学习平台的有效性。这向社区传递了一个明确信号:这款硬件不仅“能用”,而且“好学”,能够可靠地收集数据并训练出解决实际问题的AI策略。

实验结果分析:数据驱动的性能飞跃

实验部分的数据有力地支撑了Ruka-v2的设计优越性。51.3%的任务完成时间缩减是一个极其显著的提升,这直接归因于平行手腕带来的快速、精准的姿态调整能力,以及手指外展功能提供的更多样、更高效的抓取初态。在需要“探入”或“调整角度”的任务中,手腕的自由度解放了操作者,无需频繁移动整个机械臂,从而大幅提升了效率。

21.2%的成功率提升则更侧重于任务的鲁棒性和完成质量。手指的外展/内收使得抓取策略更加灵活,例如,对于易滑脱的薄物体,通过轻微张开手指形成更大的接触面积和更优化的力封闭,提高了抓取的稳定性。在需要物体在手中重新定向的任务中,这一自由度更是不可或缺。

自主策略学习的演示虽然只是初步的,但意义重大。它表明,基于Ruka-v2收集的交互数据,现代强化学习或模仿学习算法能够有效地提炼出控制策略。这为未来更复杂的长期任务、多阶段操作以及零样本泛化研究提供了坚实的物理基础。开源硬件与开源算法的结合,正在形成一个正向循环的生态系统。

实践应用与未来展望:赋能研究与产业探索

对于人工智能与机器人学习领域的研究者,Ruka-v2是一个理想的研究平台。建议可以从以下几个方向入手:

  1. 复杂操作技能学习:利用其完整的自由度,研究诸如工具使用(使用螺丝刀、笔)、柔性物体操纵(穿针引线)或非刚性装配等高级任务。
  2. 触觉感知集成:在Ruka-v2的指尖和手掌集成高分辨率触觉传感器(如DigiT或基于视觉的触觉传感器),研究如何融合触觉反馈与本体感知进行精细操作。
  3. 仿真到实物的迁移:基于开源的CAD模型,可以构建高保真的物理仿真环境(如Isaac Gym, MuJoCo),先在仿真中训练策略,再迁移到实体Ruka-v2上,研究sim2real的关键技术。
  4. 双手协同与全身控制:将两个Ruka-v2集成到一个双臂机器人上,研究双手协调操作、传递物体等社会性交互任务。

展望未来,Ruka系列的发展可能沿着以下路径演进:

  • 驱动与感知的进一步集成:探索更紧凑、扭矩密度更高的电机(如空心杯电机)以及更先进的腱绳材料,以提升速度、力度和耐久性。深度集成六维力/力矩传感器于手腕,实现真正的力控交互。
  • 模块化与可重构设计:或许未来版本可以允许用户根据任务需要,快速更换不同功能的手指模块(如带滚轮、吸盘或特种工具头)。
  • 算法与硬件的协同设计:开发专为肌腱驱动多指手优化的控制算法库,包括自适应阻抗控制、基于模型的动态补偿等,降低使用者的控制门槛。
  • 成本与可靠性的持续优化:在保持性能的前提下,通过设计优化和供应链管理,进一步降低成本,并提升长期运行的可靠性,使其能应用于更广泛的场景,如实验室自动化、轻量级工业分拣或辅助机器人。

总结:迈向通用灵巧操作的关键一步

Ruka-v2不仅仅是一个硬件版本的迭代,它代表了开源机器人社区在攻克“机器灵巧性”这一核心挑战上的重大进步。通过巧妙地引入解耦平行手腕和手指外展自由度,它在拟人化程度上迈出了一大步。更重要的是,它通过完全开源的方式,将这种进步转化为整个社区的共有资产。其严谨的性能评估和初步的学习算法演示,证明了它不仅仅是一个“玩具”或“演示品”,而是一个严肃的科研工具。

在通往通用人工智能(AGI)与通用机器人的道路上,让机器像人一样理解和操作物理世界是必经之途。Ruka-v2这样的开源灵巧硬件平台,正是在为这条道路铺设坚实而普惠的基石。它降低了创新门槛,加速了算法与物理世界的碰撞迭代,让更多研究者得以在真实的、复杂的接触交互中探索智能的边界。我们期待看到基于Ruka-v2涌现出更多突破性的机器人学习成果,也期待开源硬件生态的持续繁荣,最终推动机器人技术真正走入千家万户,解决实际难题。