特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了
偷偷努力,悄无声息地变强,然后惊艳所有人!哈哈,小伙伴们又来学习啦~今天我将给大家介绍《特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了》,这篇文章主要会讲到等等知识点,不知道大家对其都有多少了解,下面我们就一起来看一吧!当然,非常希望大家能多多评论,给出合理的建议,我们一起学习,一起进步!
特斯拉人形机器人又解锁了新技能!
昨日,Tesla Optimus 官方发布了新的 demo 视频,展示了二代 Optimus 人形机器人的最新进展。
这次,Optimus 开始进厂打工了,在特斯拉电池工厂学会了分装电池,并且比以前走得更快更远更稳了。
让我们先一睹 Optimus 的最新技能和训练细节。
现在,Optimus 的端到端神经网络经过训练,能够对特斯拉工厂的电池单元进行准确分装。
在机器人的FSD计算机上实时运行,仅仅依靠2D摄像头、手部触觉和力传感器。Optimus利用它的腿保持平衡,同时网络驱动整个上半身。
在插入过程中需要非常精确的动作,且容错率很低,神经网络会自动定位下一个空闲槽位。Optimus 还能从故障中自主恢复。
Optimus 的训练数据是通过人类远程操作收集,并针对各种任务进行了扩展。
Optimus 在工厂进行测试,人工干预率持续下降。
当然,Optimus 现在可以在定期绕着办公室行走,不仅走得更快,走的距离也越来越远了。
对此,特斯拉 Optimus(Tesla Bot)工程师 Milan Kovac 对 Optimus 的更多训练细节进行了解读。
在过去的几个月里,特斯拉出色的制造团队制造出了更多的机器人,以便进行研究并收集人工智能数据。
团队训练并部署了一个神经网络,允许 Optimus 开始执行有用的任务,例如从传送带上捡起电池单元并将它们精确地插入托盘中。
这个神经网络完全端到端运行,这意味着 Optimus 只消耗来自机器人 2D 摄像头的视频以及板载本体感受器上的数据,并直接产生关节控制序列。
Optimus 完全在机器人的嵌入式 FSD 计算机上运行,由板载电池供电。这样的设计使得单个神经网络可以通过添加更多样化的数据到训练过程中来执行多个任务。
虽然目前 Optimus 还不完美,速度还有点慢,但我们看到了越来越高的成功率和越来越少的失误。特斯拉还训练 Optimus 从失败案例中恢复,并看到了自发的校正发生。
特斯拉已经在一家工厂部署了几台 Optimus 人形机器人,它们每天都在真实的工作站上进行测试,并持续改进。
团队正在进行进一步的工作,以使 Optimus 移动更快,以及应对更恶劣的地形,同时不牺牲它的人性化特性。团队还将专注于可重复性、训练神经网络处理动态校准和机器人之间的微小差异。很快会有更多的更新。
此外,英伟达高级研究科学家、AI Agents 负责人 Jim Fan 对 Optimus 新视频展示出的技能给予了很高的评价。
他认为,视频让我们窥见了人类数据收集的真实场景,这是 Optimus 最大的优势。建立这样的流水线需要什么呢?Optimus 做到了以下几点:
Optimus 的手是世界上顶级五指灵巧型机器人手之一,它具有触觉感知,拥有 11 个自由度(DOF),相比之下许多竞品只有 6-7 个 DOF,并且具有强大的稳健性,能够在不需要持续维护的情况下承受大量的物体交互。
远程操作软件:我们可以看到人类操作员戴着 VR 眼镜和手套。设置软件以实现第一人称视频的实时传输和精确控制输出,同时保持极低延迟,这是非常了不起的。人类对于自己动作和机器人动作之间的最微小延迟都非常敏感。Optimus 有一个流畅的全身控制器,可以实时执行人类姿态。
大规模 fleet:你需要不止一个机器人来并行收集数据,需要训练有素的人类每天进行多次轮班(最好全天候),以及一个随叫随到的维护团队,以确保机器人始终处于忙碌状态。这是学术研究实验室甚至都不会考虑的大量操作复杂性。
任务与环境:弄清楚要远程操作什么也同样重要。目前,大多数此类工作都是由演示驱动的:收集你想要放入社交媒体视频中的任务数据。但想要解决通用型机器人的问题,我们需要仔细考虑任务和环境的分布。从视频的 43 秒到 51 秒部分,我们可以看到工厂和家居环境,如移动电池、处理洗衣物、将日常物品分类放入货架。
这是一个开放性的研究问题:如果你只有预算来收集 1000 个任务的训练数据,你会选择什么来最大化技能转移和泛化呢?
结论:远程操作是解决人形机器人问题的必要条件,但不足以充分解决问题。它从根本上来说无法扩展。
在评论区,马斯克预告了 Optimus 人形机器人手部的最新目标,在今年晚些时候将拥有 22 自由度(DoF)。这就更让人期待一波了。
此前,据马斯克在财报电话会议上透露,特斯拉 Optimus 人形机器人可能会在今年底拥有完成「有用的工厂任务」的能力,并计划今年底前在自家工厂率先使用。同时特斯拉有可能在 2025 年年底前对外销售 Optimus。
特斯拉人形机器人「进化史」
特斯拉人形机器人最早要追溯到 2021 年 8 月的「特斯拉 AI 日」活动上,当时马斯克首次透露了要造人形机器人(Tesla Bot)的设想。
这款人形机器人的身高大概是 1.72 米,重约 112 斤,身材匀称,还带有一张面部屏幕,能够以约 8 公里 / 小时的速度移动。
2022 年 10 月,这一年的「特斯拉 AI 日」上,Optimus 人形机器人首次亮相。彼时,它还不能做跳舞等花样表演。机器人工作时的功耗是 500W,重量达到 73 公斤,手运动的自由度有 27 个。
不过,在 Demo 演示中,Optimus 展示了其搬箱子、浇花、在特斯拉超级工厂工作的画面。
2023 年 5 月,经过半年多的蛰伏,特斯拉 Optimus 终于具备了流畅行走和抓取物体的能力。
2023 年 9 月,特斯拉 Optimus 再次进化,可以自主对物体进行分类了,亮点在于神经网络完全端到端训练:输入视频、输出控制。闲暇之余,它还能做瑜伽消遣。
2023 年 12 月,Optimus 二代到来,让人的确看到了电影《机械公敌》里的样子了。
随着新视频的发布,特斯拉人形机器人的进步速度再次令人惊叹。
终于介绍完啦!小伙伴们,这篇关于《特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

- 上一篇
- Windows11预览体验计划空白怎么办 Windows11预览体验计划空白处理方法

- 下一篇
- Windows11怎么暂停更新_Windows11暂停更新技巧
-
- 科技周边 · 人工智能 | 5小时前 | LGDisplay 蓝色磷光OLED 功耗降低 混合双栈串联OLED
- LG蓝色磷光OLED面板首发,手机功耗降15%
- 367浏览 收藏
-
- 科技周边 · 人工智能 | 6小时前 |
- Linuxautofs自动挂载详解与实现攻略
- 159浏览 收藏
-
- 科技周边 · 人工智能 | 10小时前 |
- 小米汽车SU7Ultra助力,营收曾超手机
- 247浏览 收藏
-
- 科技周边 · 人工智能 | 10小时前 |
- 浙大与阿里推出具身交互新模型——EmbodiedReasoner
- 328浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 26次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 21次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 23次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 23次使用
-
- Brev AI
- 探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
- 25次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览