微软分享元宇宙远程会议中实现2D和3D的平滑过渡方法的专利
来到golang学习网的大家,相信都是编程学习爱好者,希望在这里学习科技周边相关编程知识。下面本篇文章就来带大家聊聊《微软分享元宇宙远程会议中实现2D和3D的平滑过渡方法的专利》,介绍一下,希望对大家的知识积累有所帮助,助力实战开发!
(映维网Nweon 2023年12月26日)远程会议的发展正在推动元宇宙的普及化。然而,目前在线会议应用在使用元环境时面临一个主要问题,即并非所有参与者都使用相同类型的设备。比如,有些用户使用个人电脑进行操作,而其他用户则使用虚拟现实头显
桌面设备用户有时处于不利地位,因为他们无法导航或与虚拟环境中的所有用户进行交互。当计算机提供3D环境的2D视图时,计算机在如何接收用户导航或与3D环境交互的输入手势方面受到限制。
从目前来看,虽然技术发展迅速,但是VR头显用户和PC用户的体验并不相同。此外,无论是从VR头显过渡到桌面设备,还是反过来,现有的系统并不能在聚会或公司会议等活动中实现无缝切换
在微软的专利申请中,名为“2D和3D过渡在用户参与通信会话中的渲染”的内容详细介绍了一种相关的无缝过渡方法
图1A和1B说明了当用户参与通信会话时,用户界面安排从用户的二维图像的显示到用户的三维表示的呈现的转换。
所述通信会话可由由若干台计算机11组成的系统100来管理,每台计算机11对应于若干用户10。在本例中,第三用户10C的呈现将经历从2D模式到3D模式的转换。
为了开始转换,系统可以接收一个输入,以引起特定用户的二维图像呈现的显示转换。在这个例子中,输入标识第三个用户10C。该输入同时可以提供许可,允许系统访问为第三个用户10C定义位置和方向的3D模型。这些位置和方向可以包括在本文中称为虚拟环境200的3D环境200中表示的矢量和坐标
作为对接收输入的响应,系统100的一台或多台计算机可以对用户界面101进行修改,以删除如图1A所示的用户10C的图像151C的渲染,并添加如图1B所示的用户10C的3D表示251C的渲染。根据在3D模型中定义的坐标和/或向量,可以在3D环境中定位和定向用户10C的3D表示251C的呈现。
在本例中,删除了用户10C的2D图像的渲染,然后可以用其他渲染代替。例如,将图1A所示的第三用户10C的2D图像渲染在UI中替换为图1B所示的另一用户第四用户10D的另一2D图像。
这种转换允许用户以不同的方式与计算设备进行交互。例如,在这个例子中,如果用户10C希望从通信会话中的实时视频流切换到另一种操作模式,该模式允许用户与3D环境中的其他用户进行交互,系统会将用户从一种模式转换到另一种模式,从而使其能够与一般内容、文档、电子表格和幻灯片交互的模式切换到与3D对象交互的模式
通信会话期间的这种转换允许所选用户在每个环境中使用适合不同内容类型的编辑工具。例如,如果视频流中的一个人希望离开使用2D图像向用户显示的2D模式,并进入3D环境向其他用户展示如何在特定位置移动对象或塑造特定的3D对象,则一旦用户能够在通信会话中进行转换,他们就可以更容易地做到这一点。
用户可以使用台式PC完成这种转换,而无需使用任何类型的XR头显。使用桌面的这种转换使用户能够使用桌面计算机进入与3D计算环境交互的3D模式,这可能更适合于编辑或查看特定类型的内容。
微软指出,其中一个技术优势是,系统可以允许用户在通信会话的3D模式和2D模式之间切换,而不管他们与什么硬件进行交互。
发明所述技术同时适用于头显。在这样的实施例中,用户在将交互模型从3D计算环境转换到2D计算环境时,可以保持仅使用一个计算设备,例如头显。所以,用户可以在3D计算环境中启动,并通过3D表示251C的呈现来表示,例如图1B所示的表示。
然后,响应一个或多个输入,例如用户开始编辑具有特定文件类型的内容,或基于指示执行UI转换意图的输入,系统可以转换UI以删除3D表示251C的呈现,如图1B所示,并生成用户的2D图像151C的呈现,例如图1A所示的表示。这允许用户在不实际使用使用平面屏幕显示和键盘的桌面设备的情况下过渡到2D环境。
图2A和2B说明了当用户参与通信会话时,用户界面从具有用户的二维图像的显示到用户的三维表示的呈现的转换的另一个示例。
在这个例子中,用户界面201是基于3D模型的3D环境的呈现。用户界面201以第一用户10A的表示251A的3D呈现和第二用户10B的表示251B的3D呈现开始。每个表示的3D渲染都有一个位置和一个方向,由存储在3D模型中的虚拟对象属性决定
3D环境同时包括虚拟对象275,其形式为安装在虚拟环境墙壁的虚拟平面电视。虚拟对象275具有显示虚拟用户界面的显示表面,虚拟用户界面显示第三个用户10C的2D渲染151C和第四个用户10D的2D渲染151D。
图3A和3B说明了第三用户转换的另一个方面。在本例中,第三用户10C的呈现经历了从2D模式到3D模式的转换。
如图3A所示,用户界面301首先显示杰思敏、劳伦斯和麦克的二维图像,分别显示为图像151A、151B和151D的效果图。用户界面同时包括具有其他用户的两个3D表示251A和251B的3D环境200的呈现。
为了响应本文所述的输入数据,系统执行转换。在第三用户的过渡中,第三用户10C的第三计算机11C从图3A所示的用户界面过渡到图3B所示的用户界面。
经过转换后,夏洛特的计算机11C显示了修改后的用户界面301,如图3B所示。系统会维护每个用户的状态,就像图3A中展示的两个用户251A和251B的三维表示一样,同时还会维护图3B中展示的251A和251B的三维表示
同样如图3B所示,修改后的用户界面301包括虚拟对象275,虚拟对象275在本例中为虚拟显示设备,其显示最初以2D图像显示的其他用户的2D渲染,例如图3A中的杰思敏和劳伦斯。
这个修改后的301用户界面现在显示夏洛特的视角,就好像她从2D环境传送到3D环境一样。与其他例子类似,在这种传送中,系统可以根据一个或多个因素确定夏洛特Avatar的位置和方向。
在这样一个例子中,夏洛特可能正在操作一个设备,比如PC。然后,响应本文所述的一个或多个输入,系统可以在继续使用桌面PC的同时从图3A的用户界面过渡到图3B的用户界面。即使不使用传统上用于查看3D渲染的头显,都可以实现这个示例的过渡。
在另一个例子中,过渡可以涉及夏洛特从图3B的用户界面开始,然后过渡到图3A的用户界面的过程。在这个例子中,夏洛特可能正在操作一个单独的设备,比如头戴式显示器。她首先浏览图3B中展示的3D环境,然后通过对本文所述的一个或多个输入做出反应,系统可以从图3B的用户界面过渡到图3A的用户界面,并继续使用头戴式设备。即使不使用传统上用于查看2D图像的计算机,这个示例的转换也是可能的
图4A说明了UI转换的其他特性。当接收用于致使UI从用户10C的2D图像的呈现转换到用户10C的3D表示的呈现的输入时,系统可以确定用户10C的3D表示的位置和方向。
例如,如果一个模型在虚拟环境200中开始时只有两个代表用户的虚拟对象351A和351B,那么系统可以确定新增加的代表用户的虚拟对象351C的位置和方向。在这个例子中,当输入表明特定用户,比如第三个用户10C时,系统可以根据虚拟环境200中其他用户的位置和/或共享内容的位置,确定表示第三个用户10C的虚拟对象351C的位置和方向
在一个说明性示例中,如果系统确定用于表示第三个用户10C的虚拟对象351C将添加到虚拟环境200中,则系统可以以一种方式定位虚拟对象351C,使得虚拟对象351C呈现出用户的Avatar正在查看与用户10C共享的内容。
在另一个例子中,如果系统确定将用于代表第三个用户10C的虚拟对象351C添加到虚拟环境200中,系统可以以一种方式定位虚拟对象351C,使其看起来像是用户的Avatar正在与用户10C交谈的Avatar对话
在一个实施例中,每个虚拟对象351的放置可以基于团队成员、用户组和/或由单个用户或用户组建立的策略的分布。例如,如果一个人是公司团队的一部分,当其中一个人在转换用户界面的输入中识别时,他们对应的Avatar将被定位在其他团队成员的阈值距离内。
图4B示出系统的两种操作模式,以及每种操作模式如何改变参与通信会话的个体的权限。在图4B的上半部分的第一种操作模式中,当3D模型中不包含用户的表示时,权限可以允许系统使用图像文件来显示用户的2D图像。
在这种情况下,3D模型数据处于第一状态320A,其中所选用户在3D环境200中没有表示该用户的虚拟对象。当3D模型处于这种状态时,所选用户在3D环境中没有表示该用户的虚拟对象,与该用户关联的权限数据315配置为允许系统和其他用户访问该用户的图像数据310。这意味着所述系统和每个远程用户的客户端可以使用所述图像数据310生成该用户的呈现,或者所述系统可以编辑所述图像数据310。
当系统检测到3D模型数据处于第二状态时,例如,模型数据320B中包含代表所选用户的虚拟对象351C,系统会修改权限以限制该特定用户对图像数据的使用。根据图中所示,系统会修改权限数据315,以限制系统读取图像数据310来显示该特定用户的2D图像。在这种操作模式下,权限会被配置为限制所有用户对图像数据的访问,从而阻止所有客户端对2D图像文件的访问或显示
图5A和图5B示出了配置为在相对于共享内容的3D环境200中定位用户的表示的系统的特征。
在图5A中展示了用于第一用户351A和第二用户351B的Avatar定向,用于在3D环境中查看共享内容的场景。他们共享的内容可以显示在虚拟对象上,例如虚拟显示屏。当系统检测到有一定数量的用户正在查看共享内容时,系统会为拥有Avatar的第三个用户生成进入3D环境的方向
特征的一个示例如图5B所示。在本例中,将第三用户351C的Avatar添加到虚拟环境中。第三用户351C的Avatar指向共享内容,以响应系统检测到其他用户在其视场内具有共享内容。系统同时可以确定每个人视场的几何形状,并确定第三个用户的Avatar的位置,使得第三个用户的Avatar不会阻挡其他用户的视场。
图6A和图6B示出了配置为相对于其他用户在3D环境200中定位。图6A示出了一种场景,其中第一用户和第二用户的Avatar定向成用户在虚拟环境中相互看着。
在一个特定的团队或预先确定的群体中,当系统确定有一定数量的人在相互注视时,系统可以定位进入环境的第三个用户的Avatar,这样Avatar的位置就可以看向其他用户。图6A显示了在视场内具有至少三个具有其他组成员的用户的若干虚拟形象。当系统确定某个阈值数量的虚拟角色在视场内拥有其他组成员时,如图6B所示,系统可以允许新的组成员加入具有允许该用户查看其他组成员的位置和方向的虚拟环境。
相关专利:Microsoft Patent | 2d and 3d transitions for renderings of users participating in communication sessions
名为“2d and 3d transitions for renderings of users participating in communication sessions”的微软专利申请最初在2022年5月提交,并在日前由美国专利商标局公布。
需要注意的是,一般来说,美国专利申请接收审查后,自申请日或优先权日起18个月自动公布或根据申请人要求在申请日起18个月内进行公开。注意,专利申请公开不代表专利获批。在专利申请后,美国专利商标局需要进行实际审查,时间可能在1年至3年不等。
终于介绍完啦!小伙伴们,这篇关于《微软分享元宇宙远程会议中实现2D和3D的平滑过渡方法的专利》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

- 上一篇
- 华为与合作伙伴共同发布5G车规级模组认证标准

- 下一篇
- 网易大神社区已重新开始更新《魔兽世界》内容,原停服通知删除
-
- 科技周边 · 人工智能 | 1小时前 |
- 问界M8快报:MAX+版最火,BAL车主热捧
- 335浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 港大与Adobe联手推出PixelFlow图像生成模型
- 135浏览 收藏
-
- 科技周边 · 人工智能 | 6小时前 | 摩尔线程 招聘诈骗 @mthreads.com 官方客服 法律责任
- 摩尔线程重磅声明发布
- 406浏览 收藏
-
- 科技周边 · 人工智能 | 8小时前 |
- 玛莎拉蒂GT2Stradale国内首秀售414.5万
- 226浏览 收藏
-
- 科技周边 · 人工智能 | 11小时前 |
- 美股反弹艰难,三大指数涨跌不一,英伟达跌3%
- 301浏览 收藏
-
- 科技周边 · 人工智能 | 11小时前 |
- 本田烨品牌GT车型上海车展首发亮相
- 358浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 笔灵AI生成答辩PPT
- 探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
- 28次使用
-
- 知网AIGC检测服务系统
- 知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
- 42次使用
-
- AIGC检测-Aibiye
- AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
- 39次使用
-
- 易笔AI论文
- 易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
- 51次使用
-
- 笔启AI论文写作平台
- 笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
- 42次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览