苹果引领AR革命?Unity技术开放日x Rokid,畅谈下一代人机交互新路线
从现在开始,我们要努力学习啦!今天我给大家带来《苹果引领AR革命?Unity技术开放日x Rokid,畅谈下一代人机交互新路线》,感兴趣的朋友请继续看下去吧!下文中的内容我们主要会涉及到等等知识点,如果在阅读本文过程中有遇到不清楚的地方,欢迎留言呀!我们一起讨论,一起学习!
AR(增强现实)的里程碑被刻印着,因为苹果开创了空间计算时代的革命。由Vision Pro打造的沉浸式空间,正在为用户带来全新的人机交互体验,比如:突破传统显示屏的限制,用户浏览 app 时,只要轻松地看着它们、捏合手指来选择,即可在空中任意拖拉点击。
事实上,这也是Rokid一直探索的方向——将人、现实世界与虚拟世界的融合,更自然真实地结合在一起。
在今年3月的Rokid Open Day上,Rokid发布了全新一代自研AR空间操作系统——YodaOS-Master:基于Rokid Max Pro眼镜,张开手掌,菜单立马浮现在眼前。点击图标,便可进入应用,享受灵动随心的空间多屏互动体验。其中,业内首创基于单摄像头即可实现SLAM及3D裸手交互等能力,这一全新的技术路线,发布即引发行业的关注与热议。

今天,中国开发者最重要的年度盛典之一“2023年Unity技术开放日”首站在北京隆重举行,Rokid出席本次活动。会上Rokid系统研发总工程师石文峰带来了主题为《Rokid YodaOS-Master系统介绍及应用开发与落地》的演讲,分享了这一备受关注的技术路线,以及Rokid最新的技术发展,与现场开发者们进行了深入的交流与探讨。
Rokid全新一代自研空间AR系统
业内首创单摄SLAM技术
在今天的游戏论坛上,Rokid系统研发总工程师石文峰,结合多年丰富的AR行业技术研发经验,向现场开发者们介绍了备受关注的YodaOS-Master系统,以及Rokid背后的技术思考。
围绕感知、理解、交互、展现、协同和数字创作五个方面,YodaOS-Master从芯片优化、硬件设计、软件架构、AR算法还有创作工具等诸多方面都做了巨大升级,或是目前最为完整的一套面向AR时代的空间操作系统。

基于Rokid Max Pro眼镜,首创基于单摄像头即可实现SLAM、3D裸手交互、第一视角分享、视觉定位VPS等能力,可以支持多任务运行、空间创作等AR体验,给更轻量化、普惠的AR眼镜带来无限可能。
在YodaOS操作系统诞生之初,Rokid就秉持着一个观点,通过YodaOS操作系统赋能开发者,释放想像力,创造价值。
石文峰表示,“YodaOS-Master操作系统通过模块化的方式,将Rokid语音识别、手势识别、SLAM等在内的多项核心技术进行‘打包’处理,形成SDK供开发者高效开发,比如SDK for Unity,可以让Unity开发者能够快速使用Rokid核心技术进行开发。”

Rokid一直致力于更自然的AR交互体验。相比于传统的2D手势识别,3D手势识别更具有挑战性。文峰老师重点介绍了Rokid目前的单目3D手势识别技术,基于YodaOS-Master的底层系统能力。
基于深度学习算法和大量实验数据,Rokid自研的单目3D手势算法能在移动端实时重建手部姿态参数,包括手部6DoF、手部关节点26DoF,以及Hand Mesh信息,为AR的手势交互提供良好的算法基础。
目前,Rokid的手势识别在3D空间中可实现多种操作,包括点、捏、抓、握、拖、拉等等,完全可以满足AR交互应用需求。举个例子,只需要戴上Rokid Max Pro,然后伸出手,在眼前展开手掌即可召唤菜单。

值得一提的是,Rokid软硬件于一体的AR空间体验已在全国多个场景落地,包括全国首个基于AR眼镜的元宇宙街区项目——杭州文三元宇宙AR数字生活街区、全国文旅行业内首个基于单目视觉SLAM的AR眼镜导览方案——敦煌AR智能导,以及钉钉携手Rokid所打造的全国首个企业AR数字展厅等等。
若琪数字人+AIGC
多模态交互体验全新升级
随着AI时代的加速发展,人机交互方式的发展趋势为多模态交互。未来人们对交互方式的需求已经超越了单一的键盘、触摸和语音交互方式。
试想,如果你想要边听音乐边办公的话,需要先通过语音或触摸交互的方式唤醒音响,再通过键盘交互的方式打开办公软件。拥有一个“数字人”助手会让所有事情变得轻而易举,只需下达一个指令,就能同时完成这两项任务。

这也是Rokid做AI数字人的原因之一。石文峰表示,AI数字人技术可以串连系统所有的能力,包括语音助手AI数字人、SLAM、3D手势、6DOF空间音频等Rokid核心技术,从而为用户带来更丰富的人机交互体验。
目前,Rokid所打造的“若琪”数字人已经全面接入AIGC,用户可以随时唤起“若琪”,和这位虚拟助手探讨任何有趣的话题。
石文峰介绍,这背后采用的是AIGC多模态数字智能驱动的模式,通过ASR、NLP、TTS等自研算法技术,驱动“若琪”产生准确的面部表情、语音表达、肢体动作,并且表现得更真实、自然、流畅。
Rokid全方位赋能开发者
共同迎接下一个人机互交时代
未来的想象空间将会变得无限,因为AR、MR等技术越来越成熟,能够应用于观影、游戏、办公、教育等多种场景。多重生态内容的重新构建,亟待开发者们带来更多突破与创新。
Unity技术开放日是中国开发者最重要的年度互动盛典之一,通过每年的若干场线下巡回活动,为创作者群体搭建技术交流平台,传达技术演进路径,营建多元活跃的开发者社区氛围,同时聆听来自开发者的声音,赋能实时3D技术的内容创新与应用延展。

Rokid作为AR行业领军企业,参与共促行业繁荣。当天的活动中,Rokid除了带去最新的技术分享演讲,还在现场设置展台区,带来了包括Rokid最新AR产品与生态建设场景,供现场开发者们体验,帮助他们更直观地了解Rokid的最新技术与生态。
近年来,Rokid始终致力于赋能更多的开发者,打造了专门的AR开放平台(ar.rokid.com),推出了“若琪空间站”开发者助力计划,举办全球范围的AR应用开发大赛等,激励开发者共同参与生态共建,促进AR生态繁荣。

文峰介绍,Rokid为开发者们量身打造的“若琪空间站”开发者助力计划,在硬件设备、算法能力、开发支持、市场推广等方面全方位支持开发者。同时,Rokid联合多个行业头部企业与VC成立10亿人民币规模的生态智投联盟,对优秀的开发者直接进行投资。

Rokid not only provided strong support to developers but also held its first global AR application development competition, awarding 11 heavyweight prizes to developers from around the world.。Rokid officially launched its first XR content creation competition for universities across the country in May this year, igniting the innovative power of colleges and universities.。
未来,Rokid愿携手更多合作伙伴,一起加入AR生态构建中,打造开放共赢的生态体系,持续为行业赋能,推动AR行业加快发展,共同迎接下一个人机交互时代。
理论要掌握,实操不能落!以上关于《苹果引领AR革命?Unity技术开放日x Rokid,畅谈下一代人机交互新路线》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
如何使用 Go 语言进行机器人开发?
- 上一篇
- 如何使用 Go 语言进行机器人开发?
- 下一篇
- 为什么我的Go程序无法正确使用正则表达式库?
-
- 科技周边 · 人工智能 | 10分钟前 | 免费 大模型 核心功能 DeepSeekOCR 在线文字识别
- DeepSeekOCR识别入口及使用方法
- 153浏览 收藏
-
- 科技周边 · 人工智能 | 25分钟前 |
- 文心一言登录方法与账号安全技巧
- 117浏览 收藏
-
- 科技周边 · 人工智能 | 36分钟前 | 图像生成 豆包AI 智能对话 免费网页版 https://www.doubao.com/chat/
- 豆包AI生图入口与免费网页版功能解析
- 183浏览 收藏
-
- 科技周边 · 人工智能 | 38分钟前 |
- 印象笔记联手DeepSeek,智能文档检索升级
- 499浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | 百度AI
- 百度AI官网入口链接_智能平台直达入口
- 122浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 3178次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 3389次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 3418次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 4523次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 3797次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览

