2025-12-14 01:22来源:本站

研究人员使用了一种被称为强化学习的人工智能技术,帮助一个绰号为Cassie的两条腿机器人在不同的地形上跑了400米,并进行了立定跳远和跳高,而每个动作都没有经过明确的训练。强化学习通过奖励或惩罚AI来实现目标。在这种情况下,这种方法教会了机器人在新的情况下进行归纳和反应,而不是像之前的机器人那样停滞不前。
“我们想要突破机器人敏捷性的极限,”加州大学伯克利分校(University of California, Berkeley)的博士生李忠宇(音译)说。他参与了这个尚未经过同行评议的项目。“高级目标是教机器人学习如何像人类一样做各种动态运动。”
该团队使用模拟来训练Cassie,这种方法大大加快了它的学习时间——从几年到几周——并且使机器人无需进一步微调就能在现实世界中执行相同的技能。
首先,他们训练控制Cassie的神经网络从零开始掌握一项简单的技能,比如原地跳跃,向前走,或者向前跑而不摔倒。通过鼓励模仿它所显示的动作来教授它,其中包括从人类收集的动作捕捉数据和演示所需动作的动画。
在第一阶段完成后,团队向模型展示新的命令,鼓励机器人使用新的运动技能执行任务。一旦它在模拟环境中熟练地执行新任务,他们就会通过一种称为任务随机化的方法将训练它的任务多样化。
这使得机器人能够更好地应对意外情况。例如,当被皮带拉向一侧时,机器人能够保持稳定的跑步步态。“我们允许机器人利用它所观察到的历史,并迅速适应现实世界,”李说。
卡西在2分34秒内跑完了400米,然后在没有额外训练的情况下跳过了1.4米的跳远。
研究人员现在正计划研究如何将这种技术用于训练配备了机载摄像头的机器人。俄勒冈州立大学(Oregon State University)计算机科学教授艾伦·芬(Alan Fern)帮助开发了Cassie机器人,但没有参与这个项目,他补充说,这将比盲人完成动作更具挑战性。
他说:“该领域的下一个重要步骤是人形机器人,它们可以做真正的工作,计划活动,并以不只是脚和地面之间互动的方式与物理世界互动。”