OpenAI的AI power机器人学会了单手解魔方

摘要 名为Human Controller的YouTube频道甚至开发了自己的自解魔方,它使用3D打印核心连接可编程伺服电机。这些年来,机器已经能够以超人的速

名为Human Controller的YouTube频道甚至开发了自己的自解魔方,它使用3D打印核心连接可编程伺服电机。

这些年来,机器已经能够以超人的速度解开魔方。

换句话说,一个为特定任务而建造的、被编程为尽可能高效地执行任务的机器人通常可以造福人类,而解魔方是软件已经掌握的东西。所以开发一个机器人解魔方,即使是人形机器人也不好,尤其是Dactyl的速度很慢。

然而,OpenAI的Dactyl机器人和为其提供动力的软件在设计和使用上与专用的立方体解算器有很大不同。正如Welinder所说,OpenAI正在做的机器人工作并不是在狭窄的任务中取得优异的成绩,因为它只要求你开发更好的机器人,并对它们进行相应的编程。没有现代人工智能,这是可以做到的。

相反,Dactyl是一种自我学习的机器人手,可以像人类一样处理新的任务。它使用软件进行训练。目前,该软件试图以基本的方式复制数百万年的进化,帮助我们从小就本能地学会用手。OpenAI希望有一天它可以帮助人类开发出我们只能从科幻小说中学习的人形机器人。这种机器人可以在社会中安全运行,不会伤害我们,可以在城市街道、工厂、车间等混乱环境中执行各种任务。

为了学会单手解魔方,OpenAI没有明确写Dactyl解玩具。互联网上的免费软件可以帮你做到这一点。它还选择不对要执行的单个手部动作进行编程,因为它想自己识别这些动作。相反,机器人团队为手的底层软件提供了解决混沌多维数据集的终极目标,并使用现代AI(尤其是基于动机的深度学习品牌,称为强化学习)帮助其自行解决。训练AI智能体的方法与OpenAI开发其世界级Dota 2机器人的方法相同。

但直到最近,训练一个人工智能代理做一些虚拟的事情(比如玩电脑游戏)比训练它执行真实的任务要容易得多。这是因为它可以加快虚拟世界中执行某项任务的训练软件的速度。得益于成千上万的高端CPU和超高的性能,AI可以在短短几个月内,在现实世界中花费数万年的训练时间。强大的图形处理器并行工作。

用物理机器人进行同级训练来完成物理任务是不可行的。这也是为什么OpenAI试图在仿真环境中而不是真实世界中率先采用新的机器人训练方法,而机器人行业几乎没有尝试过这种方法。通过这种方式,该软件可以在许多不同的计算机上以加速的速度广泛实践,并希望它在开始控制真正的机器人时能够保留这些知识。

OPENAI的DACTYL机器人手由AI软件驱动

由于训练的局限性和明显的安全风险,今天商业上使用的机器人不再使用AI,而是使用非常具体的指令进行编程。“在过去,采用这种方法的方式是你使用非常专业的算法来解决任务,在那里你可以分析机器人并运行它。

“精确地模拟环境,”韦林德说。对于工厂机器人,你有一个非常精确的模型,你确切地知道你工作的环境。你很清楚它会如何拾取特定的部分。"

这也是目前机器人的通用性比人类差很多的原因。给一个机器人重新编程需要花费大量的时间、精力和金钱,这个机器人组装汽车或计算机部件的特定部分,并执行其他操作。提出一个机器人,即使是简单的任务,涉及任何水平的人类敏捷性或视觉处理,都没有经过适当的训练,这将导致严重的失败。然而,在现代AI技术的帮助下,机器人可以像人类一样建模,从而可以利用对世界的直观理解来完成从开门到煎鸡蛋的所有事情。至少这是个梦。

我们距离这种复杂程度还有几十年的时间,AI社区在软件方面(如自动驾驶汽车、机器翻译和图像识别)取得的飞跃还没有完全转化为下一代机器人。目前OpenAI只是在尝试模仿人体某一部分的复杂程度,让机器人模拟器工作起来更加自然。

这就是为什么Dactyl是模仿人手的24关节机器人手,而不是你在工厂里看到的爪形或钳形机器人手爪。对于支持Dactyl学习如何以人类的方式使用所有这些关节的软件,OpenAI在尝试解决物理立方体问题之前,已经进行了数千年的模拟训练。

“如果你想在现实世界中的机器人上进行训练,那么很明显,无论你学习什么,你都是在研究你实际上想在什么上面部署算法。这样,就简单多了。但是现在的算法需要大量的数据。训练一个真实世界的机器人并做任何复杂的事情都需要多年的经验。”韦林德说。“即使对一个人来说,也需要几年,人类需要几百万年才有能力学习算子。”

不过,在模拟中,Welinder表示,训练可以像玩游戏和其他基于AI benchmark的任务一样加速。“训练算法需要几千年的时间。但只需要几天,因为我们可以并行训练。在训练这些算法时,你不必担心机器人会损害或伤害到某人。”他补充道。然而,在过去,研究人员在尝试进行虚拟训练以在物理机器人上工作时遇到了相当大的麻烦。OpenAI表示,它是第一批真正看到这一进步的组织之一。

在给它一个真实的立方体时,Dactyl把它的训练投入使用,自己解决,它在从未明确训练过的各种条件下进行训练。这包括一只手戴着手套解锁一个立方体,用两个手指将它绑在一起,OpenAI的成员不断用其他物体戳它,并用泡沫和纸屑(如纸屑)冲洗它。

>

在通过模拟测试其技能之前,OPENAI使用模拟对DACTYL进行了数千年的培训

“我们发现,在所有这些干扰中,机器人仍然能够成功旋转魔方。但这并没有在训练中得到解决。” Welinder的OpenAI机器人团队负责人Matthias Plappert说。“当我们在物理机器人上尝试此功能时,发现的坚固性令我们感到惊讶。”

这就是为什么OpenAI认为Dactyl的新技能对于机器人硬件和AI培训的发展同等重要。即使是世界上最先进的机器人,例如行业领导者Boston Dynamics开发的类人机器人和类似狗的机器人,也无法自主运行,并且它们需要进行大量特定于任务的编程并需要频繁的人工干预才能执行基本动作。

OpenAI表示,Dactyl是迈向这类机器人的一个很小但至关重要的步骤,这种机器人可能有一天可以执行体力劳动或家务劳动,甚至可以与人类一起工作,而不是在封闭的环境中进行操作,而无需任何明确的程序来控制它们的动作。

在对未来的愿景中,机器人学习新任务并适应不断变化的环境的能力将与AI的灵活性和物理机的健壮性一样重要。“这些方法真的开始证明它们是解决我们所生活的物理世界的所有内在复杂性和混乱性的解决方案,” Plppert说。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。