在SIGGRAPH 2024上,英伟达开始引领下一波浪潮:物理AI
目前golang学习网上已经有很多关于科技周边的文章了,自己在初次阅读这些文章中,也见识到了很多学习思路;那么本文《在SIGGRAPH 2024上,英伟达开始引领下一波浪潮:物理AI》,也希望能帮助到大家,如果阅读完后真的对你学习科技周边有帮助,欢迎动动手指,评论留言并分享~
今天凌晨,老黄不仅接受了采访,与扎克伯格进行了对话,还用新产品引领了 AI 的方向。
针对全球领先的机器人制造商、AI 模型开发者和软件制造商,英伟达提供了一套全新服务、模型以及计算平台,以协助开发、训练和构建下一代人形机器人。
这套产品包括用于机器人仿真和学习的全新 NVIDIA NIM 微服务和框架、用于运行多阶段机器人工作负载的 NVIDIA OSMO 编排服务,以及支持 AI 和仿真的远程操作工作流,该工作流允许开发者使用少量人类演示数据来训练机器人。
英伟达创始人兼首席执行官黄仁勋表示:「AI 的下一波浪潮是机器人,其中最令人兴奋的发展之一是人形机器人。我们正在推进整个 NVIDIA 机器人堆栈的发展,面向全球人形机器人开发者和公司开放访问,让他们能够使用最符合其需求的平台、加速库和 AI 模型。」
NIM 微服务提供了由英伟达推理软件提供支持的预构建容器,使开发者能够将部署时间从数周缩短到几分钟。机器人专家将能够通过两项新的 AI 微服务,在 NVIDIA Isaac Sim(基于 NVIDIA Omniverse™ 平台构建的机器人仿真参考应用)中增强生成式物理 AI 仿真工作流。
- MimicGen NIM 微服务可根据 Apple Vision Pro 等空间计算设备记录的远程操作数据,生成合成运动数据。
- Robocasa NIM 微服务可在 OpenUSD(一个用于在 3D 世界中进行开发和协作的通用框架)中生成机器人任务和仿真就绪环境。
本次推出的 NVIDIA OSMO 是一项云原生托管服务,允许用户跨分布式计算资源来协调和扩展复杂的机器人开发工作流,无论是在本地还是在云端。
OSMO 大大简化了机器人训练和仿真工作流,将部署和开发周期从数月缩短到一周内。用户可以对各种任务进行可视化管理,包括合成数据生成、模型训练、强化学习以及大规模的人形机器人、自主移动机器人和工业机械臂软件在环测试。
为人形机器人开发者提供先进的数据捕获工作流
训练人形机器人的基础模型需要大量的数据。远程操作是获取人类演示数据的方法之一,但这个过程正变得越来越昂贵和漫长。
通过在 SIGGRAPH 计算机图形大会上展示的 NVIDIA AI 和 Omniverse 远程操作参考工作流,研究者和 AI 开发者能够从极少量远程捕捉的人类演示中生成大量合成运动和感知数据。
首先,开发者使用 Apple Vision Pro 捕获少量远程操作演示,随后在 NVIDIA Isaac Sim 中仿真这些录像,并使用 MimicGen NIM 微服务基于录像生成合成数据集。
开发者可以使用真实数据和合成数据对 Project GR00T 人形机器人基础模型进行训练,以节省时间和降低成本。然后,他们可以使用 Isaac Lab 中的 Robocasa NIM 微服务(一个机器人学习框架)来生成经验并重新训练机器人模型。在整个工作流中,NVIDIA OSMO 将计算任务无缝地分配给不同的资源,为开发者减少了数周的管理工作量。
通用机器人平台公司傅利叶看到了使用仿真技术综合生成训练数据的优势。
与此同时,英伟达也发布了一系列通用场景描述(OpenUSD)的重大成果。这将扩大这一通用 3D 数据交换框架在机器人、工业设计和工程领域的应用,提高开发者为 AI 新一轮发展构建高精度虚拟世界的能力。
通过基于 OpenUSD 的全新生成式 AI,以及在 Omniverse 平台构建的英伟达加速的开发框架,越来越多的行业现在能够开发出用于可视化工业设计和工程项目的应用,以及用于构建新一代物理 AI 和机器人的环境仿真的应用。
新推出的内容包括适用于 AI 模型的 NVIDIA NIM 微服务,这些微服务可生成回答用户查询的 OpenUSD 语言、生成 OpenUSDPython 代码、将材质应用于 3D 物体、理解 3D 空间和物理学以帮助加快数字孪生的开发等。其他还包括可用于机器人和工业仿真数据格式的全新 USD 连接器,以及各种开发者工具,用户可通过它们将海量 NVIDIARTX 全光线追踪数据集传输到 AppleVision Pro。
「重工业的生成式 AI 潮已经到来。直到最近,数字世界的主要用户还是创意行业;而现在,借助 NVIDIA NIM 微服务为 OpenUSD 带来的增强功能和可访问性,各个行业都可以创建基于物理学的虚拟世界和数字孪生,在加快创新的同时,为机器人这次新一轮 AI 技术热潮做好准备。」
通过 NVIDIA NIM 将生成式 AI 应用于 USD
英伟达开发的全球首个用于 OpenUSD 开发的生成式 AI 模型将以 NVIDIA NIM 微服务的形式提供。借助这些模型,开发者能够将生成式 AI copilot 和智能体整合到 USD 工作流中,拓宽 3D 世界的可能性,帮助加快 USD 在制造业、汽车行业和机器人等新工业领域的应用。
预览版中的微服务包括:
- USD Code NIM 微服务:回答常识性 OpenUSD 问题,并基于文本提示自动生成 OpenUSD-Python 代码,然后将其输入到 OpenUSD 查看应用程序(例如皮克斯的 USDView)或基于 NVIDIA Omniverse Kit 的应用,以实现相应 3D 数据的可视化。
- USD Search NIM 微服务:使开发者能够使用自然语言或图像输入,在海量 OpenUSD、3D 和图像数据库中进行搜索。
- USD Validate NIM 微服务:检查上传文件与 OpenUSD 发布版本的兼容性,并生成完全由 NVIDIA Omniverse Cloud API(应用编程接口)驱动的 RTX 渲染路径追踪图像。
即将提供的新微服务包括:
- USDLayout NIM 微服务:使用户能够基于空间智能,根据一系列文本提示组装出基于 OpenUSD 的场景。
- USDSmartMaterial NIM 微服务:预测并将逼真的材料应用于计算机辅助设计对象。
- fVDB Mesh Generation NIM 微服务:根据点云数据生成基于 OpenUSD 的网络,并通过 Omniverse Cloud API 进行渲染。
- fVDB PhysicsNIM Super-Res 微服务:对帧或帧序列执行 AI 超分辨率,生成基于 OpenUSD 的高分辨率物理仿真。
- fVDB NeRF-XL NIM 微服务:使用 Omniverse Cloud API 在 OpenUSD 中生成大规模神经辐射场。
USD 连接器为更多行业带来生成式 AI
多款适用于机器人数据格式和 Apple Vision Pro 流式传输的全新 USD 连接器将为更多行业带来 OpenUSD 互操作性与高级创作能力。
为帮助更多使用 OpenUSD 的工业工作负载,英伟达与全球工业自动化和软件领先者西门子正在扩大合作。西门子将把 OpenUSD 流水线与其 Simcenter 仿真技术组合集成,以支持基于证据的决策和关键利益相关方之间的协作。
该集成可实现复杂仿真数据的高保真、实时、逼真可视化,让企业能够更加深入地了解产品在实际操作环境中的性能。西门子将把 Omniverse 纳入到其 Teamcenter 产品生命周期管理软件组合中,为这项工作打好基础。
英伟达还发布了一个从统一机器人描述格式(Unified Robotics Description Format)到 OpenUSD 的连接器,让机器人专家能够将他们的机器人数据无缝导入到用于设计、仿真和强化学习等用途的各种应用中。
为了进一步推动 OpenUSD 生态系统的扩张,英伟达发布了 OpenUSD Exchange 软件开发套件,帮助开发者创建出自己的强大 OpenUSD 数据连接器。
新的开发者工具和 API 可通过 NVIDIA Graphics Delivery Network(GDN),将大规模 OpenUSD 场景从基于 Omniverse 平台构建的应用流式传输到 Apple Vision Pro。目前,这些新工具和 API 提供抢先体验版本。
以上就是《在SIGGRAPH 2024上,英伟达开始引领下一波浪潮:物理AI》的详细内容,更多关于英伟达,智能制造,产业的资料请关注golang学习网公众号!

- 上一篇
- golang 框架如何与数据库和缓存系统集成?

- 下一篇
- 唯卓仕预告 DC-X 系列监视器新品:6 英寸屏幕,最高亮度 2000nits
-
- 科技周边 · 人工智能 | 8小时前 |
- 腾讯混元3Dv2.5新版3D模型震撼发布
- 307浏览 收藏
-
- 科技周边 · 人工智能 | 9小时前 |
- Llama4震撼发布,Meta开源多模态AI霸主
- 417浏览 收藏
-
- 科技周边 · 人工智能 | 17小时前 | 深蓝汽车
- 深蓝汽车4月销量2.01万辆,同比增58%
- 170浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 16次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 13次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 12次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 16次使用
-
- Brev AI
- 探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
- 17次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览