当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

来源:51CTO.COM 2023-04-24 07:47:54 0浏览 收藏

本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学习~

电子技术的发展,让我们可以随时随地享受一场「视听盛宴」,人类的听觉和视觉从此彻底解放。

近几年,给设备装上「触觉」逐渐成了新的研究热点,尤其是在「元宇宙」概念的加持下,加上触感无疑能让虚拟世界的真实感大大提升。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

当下触觉感知技术主要是通过「数据驱动」的模式来模拟和渲染触感,模型首先记录下用户与真实纹理交互的信号,然后将信号输入到纹理生成部分,并用振动的方式将触感「回放」给用户。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

最近一些方法大多基于用户交互运动和高频振动信号来对纹理的特征进行建模,比如摩擦和微观表面特征。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

虽说数据驱动极大提升了模拟的真实感,但仍然存在诸多限制。

比如世界上的纹理可以说是有「无数种」,如果每种纹理都记录一遍,所需的人力、物力都不可想象,也无法满足一些小众用户的需求。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

人类对于触觉的感知相当敏感,不同的人对于相同物体的感觉也不同,数据驱动的方式无法从根本上消除从纹理记录到纹理渲染的感知不匹配问题。

最近,南加州大学维特比工程学院的三个博士生提出了一种全新的「偏好驱动」模型框架,利用人类分辨纹理细节的能力对生成的虚拟感知进行调整,最终可以达到相当逼真的触觉感知,论文发表在IEEE Transactions on Haptics.

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

论文链接:https://ieeexplore.ieee.org/document/9772285

偏好驱动的模型首先会给用户一个真实的触摸纹理,然后模型会使用几十个变量随机生成三个虚拟纹理,然后用户可以从中选择摸起来与真实物体最相似的一个纹理。

随着不断地试错和反馈,模型会通过搜索不断优化变量的分布,使得生成的纹理更接近用户的偏好。这种方法比直接记录、回放纹理具有明显优势,因为计算机读取的内容和人类的真实感受之间总是存在差距。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

这个流程实际上跟「甲方乙方」差不多,我们作为感知者(甲方),如果觉得触摸感不对劲,就打回去,让算法(乙方)修改重新生成,直到生成的效果满意为止。

这样做实际上很合理,因为不同的人摸相同的物体都会有不同的感觉,但计算机释放的信号却是相同的,所以根据每个人进行触感定制,很有必要!

整个系统由两个模块组成,首先是一个深度卷积生成对抗网络(DCGAN),用于将潜空间的向量映射到纹理模型,在UPenn Haptic Texture Toolkit (HaTT)上进行训练。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

第二个模块是一个基于比较的进化算法:一组生成的纹理模型中,协方差矩阵适应进化策略(CMA-ES)会根据用户的偏好反馈创建一个新的纹理模型以进化。

为了模拟真实纹理,研究人员首先会要求用户使用定制工具来触摸真实纹理,然后使用触觉设备触摸一组虚拟纹理候选,其中触觉反馈通过连接到设备触控笔的Haptuator来传输。

用户唯一需要做的就是选择最接近真实纹理的虚拟纹理,并使用简单的滑块接口来调整摩擦量(amount of friction),因为摩擦对于纹理触感来说至关重要,也可能因人而异。

然后所有的虚拟纹理将根据用户的选择按照进化策略进行更新,然后用户再次进行选择和调整。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

重复上述过程,直到用户找到他们认为的接近真实纹理的虚拟纹理并保存,或者找不到更接近的虚拟纹理为止。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

研究人员将评估过程分为两个阶段,每个阶段分别有一组参与者。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

在第一阶段,五名参与者分别为5个真实纹理生成和搜索虚拟纹理。

第二阶段则是评估最终保存的偏好驱动纹理(VTp)及其相应的真实纹理(RT)之间的差距。

评估的方式主要采用形容词评价(adjective rating)的方式,对包括粗糙度、硬度和光滑度等感知维度进行评估。

并且在VTp、RT和数据驱动的纹理(VTd)之间的相似性进行比较。

实验结果也表明遵循进化的过程,用户能够有效地找到一个虚拟纹理模型,真实程度超过数据驱动模型。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

此外,超过80%的参与者认为偏好驱动模型生成的虚拟纹理评级要优于数据驱动模型。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

触觉设备在视频游戏、时装设计和手术模拟中越来越受欢迎,即使在家里,我们也开始看到用户使用与笔记本电脑一样流行的那些触觉设备。

比如第一人称视频游戏加入触觉以后,会极大提升玩家的真实感。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

论文作者表示,当我们通过工具与环境交互时,触觉反馈只是一种形式,一种感官反馈,音频是另一种感官反馈,两者都非常重要。

除了游戏外,这项工作成果对于用于牙科或手术培训的虚拟纹理尤其有用,这些虚拟纹理需要非常准确。

「外科训练绝对是一个巨大的领域,需要非常逼真的纹理和触觉反馈;装修设计还需要在开发过程中对质地进行高度精确地模拟,然后再进行制造。」

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

从电子游戏到时装设计,一切都在集成触觉技术,而现有的虚拟纹理数据库可以通过这种用户偏好方法得到改进。

纹理搜索模型还可以让用户从数据库中提取虚拟纹理,例如宾夕法尼亚大学的触觉纹理工具包,可以对其进行改进,直到获得他们想要的结果。

这项技术与纹理搜索模型一结合,那你就可以使用之前别人已经记录完成的虚拟纹理,然后根据策略来优化纹理。

作者畅想,在未来,模型甚至可能不需要真实的纹理。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

我们生活中的一些常见事物的感觉是非常直观的,我们天生就可以通过查看照片来微调自己的感官,而无需参考真实的纹理。

比如当我们看到一张桌子时,我们可以想象一旦触摸到这张桌子会有什么感觉,利用我们对表面的这种先验知识,就可以向用户提供视觉反馈,并允许他们选择匹配的内容。

文章的第一作者Shihan Lu目前是南加州大学计算机科学学院的博士研究生,之前在沉浸式技术方面做过声音方面的相关工作,即通过在工具与其交互时引入匹配的声音,使虚拟纹理更加身临其境。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

文章的的第二作者Mianlun Zheng(郑棉仑)是南加州大学计算机科学学院的博士研究生,本科和硕士毕业于武汉大学。

触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法

本篇关于《触觉从未如此真实!两位南加州大学华人博士革新「触觉感知」算法》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于科技周边的相关知识,请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
iPad、iPad mini、iPad Air 或 iPad Pro:以任何价位购买哪款 iPadiPad、iPad mini、iPad Air 或 iPad Pro:以任何价位购买哪款 iPad
上一篇
iPad、iPad mini、iPad Air 或 iPad Pro:以任何价位购买哪款 iPad
如何在 iPhone 上隐藏联系人
下一篇
如何在 iPhone 上隐藏联系人
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • PPTFake答辩PPT生成器:一键生成高效专业的答辩PPT
    PPTFake答辩PPT生成器
    PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
    13次使用
  • SEO标题Lovart AI:全球首个设计领域AI智能体,实现全链路设计自动化
    Lovart
    SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
    14次使用
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    27次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    26次使用
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    53次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码