在SIGGRAPH 2024上,英伟达开始引领下一波浪潮:物理AI
目前golang学习网上已经有很多关于科技周边的文章了,自己在初次阅读这些文章中,也见识到了很多学习思路;那么本文《在SIGGRAPH 2024上,英伟达开始引领下一波浪潮:物理AI》,也希望能帮助到大家,如果阅读完后真的对你学习科技周边有帮助,欢迎动动手指,评论留言并分享~
今天凌晨,老黄不仅接受了采访,与扎克伯格进行了对话,还用新产品引领了 AI 的方向。
针对全球领先的机器人制造商、AI 模型开发者和软件制造商,英伟达提供了一套全新服务、模型以及计算平台,以协助开发、训练和构建下一代人形机器人。
这套产品包括用于机器人仿真和学习的全新 NVIDIA NIM 微服务和框架、用于运行多阶段机器人工作负载的 NVIDIA OSMO 编排服务,以及支持 AI 和仿真的远程操作工作流,该工作流允许开发者使用少量人类演示数据来训练机器人。
英伟达创始人兼首席执行官黄仁勋表示:「AI 的下一波浪潮是机器人,其中最令人兴奋的发展之一是人形机器人。我们正在推进整个 NVIDIA 机器人堆栈的发展,面向全球人形机器人开发者和公司开放访问,让他们能够使用最符合其需求的平台、加速库和 AI 模型。」
NIM 微服务提供了由英伟达推理软件提供支持的预构建容器,使开发者能够将部署时间从数周缩短到几分钟。机器人专家将能够通过两项新的 AI 微服务,在 NVIDIA Isaac Sim(基于 NVIDIA Omniverse™ 平台构建的机器人仿真参考应用)中增强生成式物理 AI 仿真工作流。
- MimicGen NIM 微服务可根据 Apple Vision Pro 等空间计算设备记录的远程操作数据,生成合成运动数据。
- Robocasa NIM 微服务可在 OpenUSD(一个用于在 3D 世界中进行开发和协作的通用框架)中生成机器人任务和仿真就绪环境。
本次推出的 NVIDIA OSMO 是一项云原生托管服务,允许用户跨分布式计算资源来协调和扩展复杂的机器人开发工作流,无论是在本地还是在云端。
OSMO 大大简化了机器人训练和仿真工作流,将部署和开发周期从数月缩短到一周内。用户可以对各种任务进行可视化管理,包括合成数据生成、模型训练、强化学习以及大规模的人形机器人、自主移动机器人和工业机械臂软件在环测试。
为人形机器人开发者提供先进的数据捕获工作流
训练人形机器人的基础模型需要大量的数据。远程操作是获取人类演示数据的方法之一,但这个过程正变得越来越昂贵和漫长。
通过在 SIGGRAPH 计算机图形大会上展示的 NVIDIA AI 和 Omniverse 远程操作参考工作流,研究者和 AI 开发者能够从极少量远程捕捉的人类演示中生成大量合成运动和感知数据。
首先,开发者使用 Apple Vision Pro 捕获少量远程操作演示,随后在 NVIDIA Isaac Sim 中仿真这些录像,并使用 MimicGen NIM 微服务基于录像生成合成数据集。
开发者可以使用真实数据和合成数据对 Project GR00T 人形机器人基础模型进行训练,以节省时间和降低成本。然后,他们可以使用 Isaac Lab 中的 Robocasa NIM 微服务(一个机器人学习框架)来生成经验并重新训练机器人模型。在整个工作流中,NVIDIA OSMO 将计算任务无缝地分配给不同的资源,为开发者减少了数周的管理工作量。
通用机器人平台公司傅利叶看到了使用仿真技术综合生成训练数据的优势。
与此同时,英伟达也发布了一系列通用场景描述(OpenUSD)的重大成果。这将扩大这一通用 3D 数据交换框架在机器人、工业设计和工程领域的应用,提高开发者为 AI 新一轮发展构建高精度虚拟世界的能力。
通过基于 OpenUSD 的全新生成式 AI,以及在 Omniverse 平台构建的英伟达加速的开发框架,越来越多的行业现在能够开发出用于可视化工业设计和工程项目的应用,以及用于构建新一代物理 AI 和机器人的环境仿真的应用。
新推出的内容包括适用于 AI 模型的 NVIDIA NIM 微服务,这些微服务可生成回答用户查询的 OpenUSD 语言、生成 OpenUSDPython 代码、将材质应用于 3D 物体、理解 3D 空间和物理学以帮助加快数字孪生的开发等。其他还包括可用于机器人和工业仿真数据格式的全新 USD 连接器,以及各种开发者工具,用户可通过它们将海量 NVIDIARTX 全光线追踪数据集传输到 AppleVision Pro。
「重工业的生成式 AI 潮已经到来。直到最近,数字世界的主要用户还是创意行业;而现在,借助 NVIDIA NIM 微服务为 OpenUSD 带来的增强功能和可访问性,各个行业都可以创建基于物理学的虚拟世界和数字孪生,在加快创新的同时,为机器人这次新一轮 AI 技术热潮做好准备。」
通过 NVIDIA NIM 将生成式 AI 应用于 USD
英伟达开发的全球首个用于 OpenUSD 开发的生成式 AI 模型将以 NVIDIA NIM 微服务的形式提供。借助这些模型,开发者能够将生成式 AI copilot 和智能体整合到 USD 工作流中,拓宽 3D 世界的可能性,帮助加快 USD 在制造业、汽车行业和机器人等新工业领域的应用。
预览版中的微服务包括:
- USD Code NIM 微服务:回答常识性 OpenUSD 问题,并基于文本提示自动生成 OpenUSD-Python 代码,然后将其输入到 OpenUSD 查看应用程序(例如皮克斯的 USDView)或基于 NVIDIA Omniverse Kit 的应用,以实现相应 3D 数据的可视化。
- USD Search NIM 微服务:使开发者能够使用自然语言或图像输入,在海量 OpenUSD、3D 和图像数据库中进行搜索。
- USD Validate NIM 微服务:检查上传文件与 OpenUSD 发布版本的兼容性,并生成完全由 NVIDIA Omniverse Cloud API(应用编程接口)驱动的 RTX 渲染路径追踪图像。
即将提供的新微服务包括:
- USDLayout NIM 微服务:使用户能够基于空间智能,根据一系列文本提示组装出基于 OpenUSD 的场景。
- USDSmartMaterial NIM 微服务:预测并将逼真的材料应用于计算机辅助设计对象。
- fVDB Mesh Generation NIM 微服务:根据点云数据生成基于 OpenUSD 的网络,并通过 Omniverse Cloud API 进行渲染。
- fVDB PhysicsNIM Super-Res 微服务:对帧或帧序列执行 AI 超分辨率,生成基于 OpenUSD 的高分辨率物理仿真。
- fVDB NeRF-XL NIM 微服务:使用 Omniverse Cloud API 在 OpenUSD 中生成大规模神经辐射场。
USD 连接器为更多行业带来生成式 AI
多款适用于机器人数据格式和 Apple Vision Pro 流式传输的全新 USD 连接器将为更多行业带来 OpenUSD 互操作性与高级创作能力。
为帮助更多使用 OpenUSD 的工业工作负载,英伟达与全球工业自动化和软件领先者西门子正在扩大合作。西门子将把 OpenUSD 流水线与其 Simcenter 仿真技术组合集成,以支持基于证据的决策和关键利益相关方之间的协作。
该集成可实现复杂仿真数据的高保真、实时、逼真可视化,让企业能够更加深入地了解产品在实际操作环境中的性能。西门子将把 Omniverse 纳入到其 Teamcenter 产品生命周期管理软件组合中,为这项工作打好基础。
英伟达还发布了一个从统一机器人描述格式(Unified Robotics Description Format)到 OpenUSD 的连接器,让机器人专家能够将他们的机器人数据无缝导入到用于设计、仿真和强化学习等用途的各种应用中。
为了进一步推动 OpenUSD 生态系统的扩张,英伟达发布了 OpenUSD Exchange 软件开发套件,帮助开发者创建出自己的强大 OpenUSD 数据连接器。
新的开发者工具和 API 可通过 NVIDIA Graphics Delivery Network(GDN),将大规模 OpenUSD 场景从基于 Omniverse 平台构建的应用流式传输到 Apple Vision Pro。目前,这些新工具和 API 提供抢先体验版本。
以上就是《在SIGGRAPH 2024上,英伟达开始引领下一波浪潮:物理AI》的详细内容,更多关于英伟达,智能制造,产业的资料请关注golang学习网公众号!

- 上一篇
- golang 框架如何与数据库和缓存系统集成?

- 下一篇
- 唯卓仕预告 DC-X 系列监视器新品:6 英寸屏幕,最高亮度 2000nits
-
- 科技周边 · 人工智能 | 23秒前 |
- GitMCP开源,GitHub变实时文档中心
- 501浏览 收藏
-
- 科技周边 · 人工智能 | 11分钟前 |
- 即梦AI作品分享技巧与发布教程
- 417浏览 收藏
-
- 科技周边 · 人工智能 | 25分钟前 |
- DeepSeek多账号切换设置方法
- 461浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- AI瑜伽教学搭配豆包,轻松练出好身材
- 353浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 豆包AI搭建Python环境,3命令快速隔离配置
- 348浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- AI+图文库,定制视频新玩法
- 239浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- Deepseek满血版携手ScribbleDiffusionPro绘图
- 162浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 豆包大模型如何搭配AI修复工具?教程详解
- 285浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 豆包AI优化Log4j的5个实用技巧
- 102浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- AI视频全流程解析,文案剪辑一键搞定
- 434浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 498次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 千音漫语
- 千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
- 170次使用
-
- MiniWork
- MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
- 169次使用
-
- NoCode
- NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
- 172次使用
-
- 达医智影
- 达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
- 178次使用
-
- 智慧芽Eureka
- 智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
- 190次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览