马斯克:机器人与人类的比例将至少是 2:1

Wallstreetcn
2024.05.06 03:10
portai
I'm PortAI, I can summarize articles.

马斯克表示,特斯拉公司将推出新的 Optimus 机器人,预计机器人与人类的比例将至少是 2:1。Optimus 机器人具备 22 个自由度,执行器移至前臂,与人类的工作方式相似。该机器人可用于工厂中分拣电芯等任务,利用神经网络和摄像头等技术进行端对端运行。目前,Optimus 机器人在工厂和办公室进行测试,并不断改进。

1. 昨天,特斯拉通过 X 平台的 “Tesla Optimus” 官方账号,发布了 Optimus 机器人在工厂中分拣电芯的最新 90 秒演示视频。配文:Trying to be useful lately!(最近在努力变得有用!)

2. Optimus 项目负责人 Milan Kovac 发文介绍了具体进展:

“在过去的几个月里,我们杰出的生产团队为我们制造了更多的机器人,并从它们那里收集人工智能数据!

我们已经训练并部署了一个神经网络,让 Optimus 可以开始执行一些有用的任务,例如拾取从传送带上传递下来的电芯,并将它们精确地放入托盘中。

这个神经网络完全以端对端的方式运行,这意味着,它只使用来自机器人二维摄像头的视频,以及机载的本体感觉传感器,就能直接生成关节控制序列。它完全在机器人的嵌入式 FSD 计算机上运行,由机载电池供电。它的设计理念是,当我们在训练过程中添加更多不同的数据时,单个神经网络可以执行多项任务。

虽然还不够完美,速度也还有点慢,但我们看到成功率越来越高,失误也越来越少。我们还在训练 Optimus 从失败案例中恢复,我们已经看到了自主修正的发生。

我们在一家工厂部署了几个机器人,每天在真实工作站对它们进行测试,并不断改进!

现在,Optimus 还经常在办公室里散步,而不会摔倒。:)

我们还在进行进一步的工作,让它移动得更快,并能应对更恶劣的地形——所有这一切都不会牺牲它与人类相似的特性。我们还在关注整个机器人队伍的可重复性、训练神经网络处理动态校准,以及机器人之间的微小差异。

更多更新将很快发布!”

负责机器人 AI 的资深工程师 Julian Ibarz 也发帖:

“在不久的将来,特斯拉机器人将能完成令人难以置信的事情。

10 年前,我在生产中部署了第一个深度学习视觉模型:https://tinyurl.com/3x2j5t6r。(注:当时 Julian 就职于谷歌)

10 年后的今天,深度学习可以做很多新的事情。想象一下,10 年后会是怎样。我之所以加入特斯拉,是因为现在正是通用具身人工智能的时代。

我们开始将 RL(强化学习)应用于 Optimus,教它做一些原本很难远程操作的事情。我们正在寻找几名 RL 工程师加入世界一流的 ML(机器学习)团队,同时也在寻找几名充满热情的软件工程师帮助改进我们的 RL 仿真基础设施:http://ts.la/optimus-jobs。”

3. Nvidia 具身人工智能实验室负责人 Jim Fan 发来贺信:

“祝贺特斯拉 Optimus 团队的又一次出色更新!这段视频让我们看到了他们的人类数据收集农场,我相信这是 Optimus 最大的领先优势。建立这样一条管道需要做些什么?Optimus 做到了以下几点:

a. Optimus 的手是世界上最好的机器人五指灵巧手之一。它具有触觉传感功能、11 个自由度(DOF),而许多竞争对手只有 6-7 个自由度。

b. 远程操作软件:我们可以看到,人类操作员戴着 VR 眼镜和手套。要在保持极低延迟的情况下,将第一人称视频流导入,并将精确控制流导出,软件的搭建是非常不容易的。自己的动作与机器人的动作之间哪怕有最微小的延迟,人类都会非常敏感。Optimus 有一个自如的全身控制器,可以实时做出人类的姿势。

c. 庞大的机器人队伍:你需要不止一个机器人来并行收集数据,需要训练有素的人类合同工每天轮流值班(最好是 24/7 全天无休),还需要随叫随到的维护人员来确保机器人始终处于忙碌状态。这些都是学术研究实验室想都不敢想的操作复杂性。

d. 任务与环境:确定应该远程操作什么内容同样重要。目前,大多数此类工作都是由演示驱动的:收集有关任务的数据,并将其制作成社交媒体视频。但要解决通用机器人的问题,我们必须仔细考虑任务和环境的分布。在视频的 43"-51"处,我们可以看到工厂和家庭环境,如移动电池、处理衣物、将日常用品分类放入货架。

这是一个开放式的研究问题:如果你只有预算来收集 1000 项任务的训练数据,你会选择什么来最大限度地实现技能转移和泛化?

结束语:远程操作是解决人形机器人问题的必要条件,但并不充分。从根本上说,它无法扩展。后续我将展开谈谈这一点。”

埃隆作出了两个回复:

今年晚些时候,新的 Optimus 机器人将有 22 个自由度。

执行器将几乎完全移至前臂,就像人类的工作方式一样。”

人类手掌的 22 个关节,不清楚是否会严格对应埃隆所说的新 Optimus 手的 22 个自由度

4. 2022 年 9 月 30 日,特斯拉第二届 AI Day,在第一次展示了真正的 Optimus 原型机器人后,埃隆说:

“我们的目标,是尽快生产一个有用的人形机器人。设计这个机器人的时候,我们采用了和设计汽车相同的原则,也就是,为了生产而设计,这样才有可能以高产量,低成本,高可靠性地生产机器人。这一点非常重要。

你们都看过非常震撼的人形机器人的演示,很棒,但它们缺少什么呢?它们缺少大脑,它们没有足够的智能可以自行在这个世界中漫游。而且它们还非常昂贵,产量也很低。

而 Optimus 的设计目标是:能力极强,同时产量极高,最终可能会生产数百万个。而且预计它的成本会比汽车低得多,我想说,可能不到两万美元,这是我的猜测。它的潜力深不可测。

。。。

如我所说,它的潜力深不可测。因为你可以说,什么是经济?经济是开展生产的实体数量乘以生产力,人口乘以人均产出。一旦人口数量没有限制,经济究竟意味着什么,也就不那么清晰了,经济会接近无穷大。

一旦能用良好的方式实现,那就意味着,一个富足的未来,一个没有贫穷的未来。到那时,你可以拥有你想要的任何产品和服务,这的确是我们所知人类文明的一个根本性转变。

。。。

如我所说,自动驾驶汽车肯定会对世界产生巨大的影响。我认为,它们将把运输生产力提高至少半个数量级,也许一个数量级,甚至更多。我认为,在改善经济产出方面,Optimus 可能有两个数量级的潜力,真正的潜力尚未可知。”

5. 4 月 23 日,在特斯拉 2024 年一季度财报电话会议上,埃隆回答了 “Optimus 目前有没有在执行工厂的任务,何时量产” 的投资者提问:

“我们能够完成简单的工厂任务。或者至少应该说,在实验室里完成工厂的任务。

事实上,我们认为,在今年年底之前,我们就能让限量生产的 Optimus 在实际工厂中执行有用的任务。然后,我认为我们可能会在明年年底之前进行对外销售。

这些只是猜测。

正如我之前所说,我认为 Optimus 比其他所有产品加起来都更有价值,因为如果我们能有一个智能的人形机器人,它能穿行于现实世界,并能按要求完成任务,那么经济的规模将不再有任何限制。这就是未来的发展趋势。

我认为,在所有人形机器人制造商中,特斯拉最有希望实现机器人的量产,并让它自己进行高效的推理计算。”

6. 5 月 2 日,X 用户 Smoke-away 发推问:

“你准备拥有几个 Optimus 机器人,为什么?”

埃隆回复:

我认为机器人与人类的比例将至少是 2:1,也许是 3 或 4:1,因为在工业领域将有许多机器人生产产品和提供服务,通常是为供应链中的其他机器人提供服务”

5 月 5 日,同样是这个 Smoke-away 发了个畅想图,并称:“特斯拉 Robotaxi 中心枢纽将使用 Optimus 进行自动充电和清洁。”

埃隆给这个帖子点了赞。

本文作者:瓦砾老瓦,来源:瓦砾村夫,原文标题:《马斯克:机器人与人类的比例将至少是 2:1》