当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 清北团队进军具身智能,银河通用、灵初智能、星海图齐发力

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力

2025-01-23 16:27:35 0浏览 收藏

亲爱的编程学习爱好者,如果你点开了这篇文章,说明你对《清北团队进军具身智能,银河通用、灵初智能、星海图齐发力》很感兴趣。本篇文章就来给大家详细解析一下,主要介绍一下,希望所有认真读完的童鞋们,都有实质性的提高。

具身智能领域创业热潮涌动,技术路线和数据来源选择成为焦点。近期清华、北大团队密集发布的研究成果,为我们解读行业趋势提供了重要线索。

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力

成立于2023年初的银河通用,由前如布科技联合创始人尹方鸣和姚腾洲以及北大助理教授王鹤共同创立。该公司秉持低成本仿真路线,历经两年研发,近期重磅推出GraspVLA模型。该模型与RoboCasa、RoboGen等类似,通过在海量合成仿真环境中生成机器人数据进行训练。GraspVLA专注于抓取任务,将预训练的AnyGrasp模型部署到仿真环境中,采集大量数据训练VLA模型,并通过引入随机化因素提升模型泛化能力。

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力AnyGrasp、GraspVLA、OpenVLA演示视频对比

成立于2024年9月的灵初智能,由前京东机器人总裁王启斌、机器人算法负责人柴晓杰、李飞飞学生陈源培以及北大助理教授杨耀东和梁一韬共同创立。

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力Psi R0演示视频

与银河通用类似,灵初智能也在仿真环境中进行大规模预训练,但其在模仿学习中融合了强化学习技术以及真机数据对齐微调,即使仅使用少量仿真和真机数据,也能实现复杂任务的泛化,并实现不同技能的流畅衔接操作。2024年12月底发布的Psi R0模型,成功完成了双手协作长程泛化打包任务,展现出其强大的商业化潜力。

灵初智能此前发布的乐高组装成果,同样展现了其在长程灵巧手任务上的突破,超越了以往强力抓取的局限,实现了更灵活的抓取和精细动作。据公开信息,灵初智能将于3月份发布自研机器人本体及更泛化的具身大模型。

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力乐高组装演示视频

在数据选择方面,成立于2023年9月的清华系星海图持截然不同的观点,他们认为数据价值排序为:真机数据 > 互联网数据 > 仿真数据。星海图CEO为Momenta前执行董事高继扬,科学家团队包括清华助理教授赵行和许华哲。他们计划今年发布100万条真机数据,明年发布1000万条。

星海图计划采用真机数据主导的预训练方式,而非灵初和银河的大规模仿真数据预训练。但大规模真机数据存在多样性不足的问题,难以实现泛化能力的涌现。

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力星海图Real2Sim2Real演示视频

在仿真数据方面,星海图强调Real2Sim2Real后训练,将仿真数据作为后训练的强化手段,在仿真中对真实数据进行随机化扩充,以实现更高的成功率和更好的落地效果。

清北团队进军具身智能,银河通用、灵初智能、星海图齐发力

这三家清北团队在算法和数据选择上各有侧重:灵初智能强调强化学习算法,银河通用强调仿真数据,星海图强调真实数据。但三家公司都采用了仿真和真实数据结合的方法,只是在预训练和后训练阶段对不同数据类型的比例有所侧重。

我们期待这三家极具潜力的公司未来带来更多惊喜。清华、北大作为具身智能创新的先锋,近期还有许多值得关注的研究成果,例如清华星动纪元ERA-42、北大与国地共建具身智能中心RoboMind、北大与智元OmniManip、清华千寻智能CoPa和Data Scaling Law等,都值得深入分析。

以上就是《清北团队进军具身智能,银河通用、灵初智能、星海图齐发力》的详细内容,更多关于产业,具身智能,创业公司,机器人技术,清华大学的资料请关注golang学习网公众号!

Diff JSON:简化 JSON 比较Diff JSON:简化 JSON 比较
上一篇
Diff JSON:简化 JSON 比较
【专利】北方华创“一种腔室清洁方法及半导体工艺设备”专利公布;基本半导体“碳化硅基集成SBD和SGT器件及其制备方法”专利公布;一微半导体“一种n倍脉宽扩展电路及脉宽扩展的锁相环系统”专利获授权
下一篇
【专利】北方华创“一种腔室清洁方法及半导体工艺设备”专利公布;基本半导体“碳化硅基集成SBD和SGT器件及其制备方法”专利公布;一微半导体“一种n倍脉宽扩展电路及脉宽扩展的锁相环系统”专利获授权
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 毕业宝AIGC检测:AI生成内容检测工具,助力学术诚信
    毕业宝AIGC检测
    毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
    18次使用
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    29次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    27次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    30次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    32次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码