清北团队进军具身智能,银河通用、灵初智能、星海图齐发力
亲爱的编程学习爱好者,如果你点开了这篇文章,说明你对《清北团队进军具身智能,银河通用、灵初智能、星海图齐发力》很感兴趣。本篇文章就来给大家详细解析一下,主要介绍一下,希望所有认真读完的童鞋们,都有实质性的提高。
具身智能领域创业热潮涌动,技术路线和数据来源选择成为焦点。近期清华、北大团队密集发布的研究成果,为我们解读行业趋势提供了重要线索。
成立于2023年初的银河通用,由前如布科技联合创始人尹方鸣和姚腾洲以及北大助理教授王鹤共同创立。该公司秉持低成本仿真路线,历经两年研发,近期重磅推出GraspVLA模型。该模型与RoboCasa、RoboGen等类似,通过在海量合成仿真环境中生成机器人数据进行训练。GraspVLA专注于抓取任务,将预训练的AnyGrasp模型部署到仿真环境中,采集大量数据训练VLA模型,并通过引入随机化因素提升模型泛化能力。
AnyGrasp、GraspVLA、OpenVLA演示视频对比
成立于2024年9月的灵初智能,由前京东机器人总裁王启斌、机器人算法负责人柴晓杰、李飞飞学生陈源培以及北大助理教授杨耀东和梁一韬共同创立。
Psi R0演示视频
与银河通用类似,灵初智能也在仿真环境中进行大规模预训练,但其在模仿学习中融合了强化学习技术以及真机数据对齐微调,即使仅使用少量仿真和真机数据,也能实现复杂任务的泛化,并实现不同技能的流畅衔接操作。2024年12月底发布的Psi R0模型,成功完成了双手协作长程泛化打包任务,展现出其强大的商业化潜力。
灵初智能此前发布的乐高组装成果,同样展现了其在长程灵巧手任务上的突破,超越了以往强力抓取的局限,实现了更灵活的抓取和精细动作。据公开信息,灵初智能将于3月份发布自研机器人本体及更泛化的具身大模型。
乐高组装演示视频
在数据选择方面,成立于2023年9月的清华系星海图持截然不同的观点,他们认为数据价值排序为:真机数据 > 互联网数据 > 仿真数据。星海图CEO为Momenta前执行董事高继扬,科学家团队包括清华助理教授赵行和许华哲。他们计划今年发布100万条真机数据,明年发布1000万条。
星海图计划采用真机数据主导的预训练方式,而非灵初和银河的大规模仿真数据预训练。但大规模真机数据存在多样性不足的问题,难以实现泛化能力的涌现。
星海图Real2Sim2Real演示视频
在仿真数据方面,星海图强调Real2Sim2Real后训练,将仿真数据作为后训练的强化手段,在仿真中对真实数据进行随机化扩充,以实现更高的成功率和更好的落地效果。
这三家清北团队在算法和数据选择上各有侧重:灵初智能强调强化学习算法,银河通用强调仿真数据,星海图强调真实数据。但三家公司都采用了仿真和真实数据结合的方法,只是在预训练和后训练阶段对不同数据类型的比例有所侧重。
我们期待这三家极具潜力的公司未来带来更多惊喜。清华、北大作为具身智能创新的先锋,近期还有许多值得关注的研究成果,例如清华星动纪元ERA-42、北大与国地共建具身智能中心RoboMind、北大与智元OmniManip、清华千寻智能CoPa和Data Scaling Law等,都值得深入分析。
以上就是《清北团队进军具身智能,银河通用、灵初智能、星海图齐发力》的详细内容,更多关于产业,具身智能,创业公司,机器人技术,清华大学的资料请关注golang学习网公众号!

- 上一篇
- Diff JSON:简化 JSON 比较

- 下一篇
- 【专利】北方华创“一种腔室清洁方法及半导体工艺设备”专利公布;基本半导体“碳化硅基集成SBD和SGT器件及其制备方法”专利公布;一微半导体“一种n倍脉宽扩展电路及脉宽扩展的锁相环系统”专利获授权
-
- 科技周边 · 人工智能 | 55秒前 |
- 笔尖AIAPI接入与安全使用指南
- 182浏览 收藏
-
- 科技周边 · 人工智能 | 3分钟前 |
- AI+豆包雕刻设计教程详解
- 303浏览 收藏
-
- 科技周边 · 人工智能 | 10分钟前 |
- Gemini支持量子通信模拟吗
- 333浏览 收藏
-
- 科技周边 · 人工智能 | 54分钟前 |
- PerplexityAI扩展方法与插件教程
- 225浏览 收藏
-
- 科技周边 · 人工智能 | 54分钟前 |
- AI生成视频字幕与镜头配图技巧
- 285浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- Gemini多模态实战教程:调用GoogleAPI全攻略
- 244浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- AI剪辑接单赚钱靠谱吗?
- 417浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 豆包AI如何处理Python异常?
- 260浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- AI配音视频生成,轻松制作解说短视频
- 391浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 498次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 千音漫语
- 千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
- 216次使用
-
- MiniWork
- MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
- 215次使用
-
- NoCode
- NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
- 211次使用
-
- 达医智影
- 达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
- 218次使用
-
- 智慧芽Eureka
- 智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
- 237次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览