光动嘴就能玩原神!用AI切换角色,还能攻击敌人,网友:“绫华,使用神里流·霜灭”
有志者,事竟成!如果你在学习科技周边,那么本文《光动嘴就能玩原神!用AI切换角色,还能攻击敌人,网友:“绫华,使用神里流·霜灭”》,就很适合你!文章讲解的知识点主要包括,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~
说到这两年风靡全球的国产游戏,原神肯定是当仁不让。
根据5月公布的本年度Q1季度手游收入调查报告,在抽卡手游里《原神》以5.67亿美金的绝对优势稳稳拿下第一,这也宣告《原神》在上线短短18个月之后单在手机平台总收入就突破30亿美金(大约RM130亿)。
如今,开放须弥前最后的2.8海岛版本姗姗来迟,在漫长的长草期后终于又有新的剧情和区域可以肝了。
不过不知道有多少“肝帝”,现在海岛已经满探索,又开始长草了。
宝箱总共182个+1个摩拉箱(不计入)
长草期根本没在怕的,原神区从来不缺整活儿。
这不,在长草期间,就有玩家用XVLM+wenet+STARK做了一个语音控制玩原神的项目。
比如,当说出“用战术3攻击中间的火史莱姆”时,钟离先是一个套盾,凌华一个霰步后紧接着一个“失礼了”,团灭了4只火史莱姆。
同样,在说出“攻击中间的大丘丘人”后,迪奥娜长E套盾,凌华紧接着一个E然后3A一重漂亮地收拾掉了两只大丘丘人。
可以在左下方看到,整个过程都没有用手进行任何操作。
文摘菌直呼内行,以后打本连手也能省了,并表示妈妈再也不用担心玩原神玩出腱鞘炎了!
目前该项目已经在GitHub上开源:
GitHub链接:
https://github.com/7eu7d7/genshin_voice_play
好好的原神,硬是被玩成了神奇宝贝
这样的整活项目自然也是吸引到了不少原神长草玩家的目光。
比如有玩家就建议到,可以设计得更中二一点,直接用角色名加技能名,毕竟“战术3”这样的指令观众也无法第一时间知道,而“钟离,使用地心”就很容易代入游戏体验。
更有网友表示,既然都能对怪指令,那是不是也可以对人物语音,比如“龟龟,使用霜灭”。
龟龟每日疑惑.jpg
不过,这么这些指令怎么看上去有股似曾相识的味道?
对此up主“薛定谔の彩虹猫”表示,喊技能的话语速可能会跟不上,攻击速度会变慢,这才自己预设了一套。
不过像是一些经典队伍,比如“万达国际”“雷九万班”的输出手法倒也算是相对固定,预设攻击顺序和模式似乎也行得通。
当然除了玩梗之外,网友们也在集思广益,提出了不少优化意见。
比如直接用“1Q”让1号位角色放大招,重击用“重”表示,闪避则用“闪”,这样的话下达指令也能更简单迅速一些,或许还能用来打深渊。
也有内行玩家表示,这个AI似乎有点“不大理解环境”,“下一步可以考虑加上SLAM”,“实现360度的全方位目标检测”。
up主表示,下一步要做“全自动刷本,传送,打怪,领奖励一条龙”,那似乎也还可以加一个自动强化圣遗物功能,歪了就把AI格式化了。
原神区硬核整活up主还出过“提瓦特钓鱼指南”
正如文摘菌所说,原神区从不缺整活儿,而这位up主“薛定谔の彩虹猫”应该是其中最“硬核”的了。
从“AI自动摆放迷宫”,到“AI自动演奏”,原神出的每个小游戏可以说是应AI尽AI了。
其中文摘菌也发现了“AI自动钓鱼”项目(好家伙原来也是你),只需要启动程序,提瓦特的鱼全都能变成囊中之物。
原神自动钓鱼AI由两部分模型组成:YOLOX和DQN:
YOLOX 用于鱼的定位和类型的识别以及鱼竿落点的定位;
DQN 用于自适应控制钓鱼过程的点击,让力度落在最佳区域内。
此外,该项目还用到了迁移学习、半监督学习来进行训练。模型也包含了一些使用opencv等传统数字图像处理方法实现的不可学习部分。
项目地址:
https://github.com/7eu7d7/genshin_auto_fish
等3.0更新后还需要钓鱼获得的“咸鱼弓”,就拜托你了!
那些把原神变成神奇宝贝的“神器”
作为一个严肃的人,文摘菌觉得也有必要给大家科普一下这次原神语音项目用到的几个“神器”。
X-VLM是一种基于视觉语言模型(VLM)的多粒度模型,由图像编码器、文本编码器和跨模态编码器组成,跨模态编码器在视觉特征和语言特征之间进行跨模态注意,以学习视觉语言对齐。
学习多粒度对齐的关键是优化X-VLM:1)通过结合边框回归损失和IoU损失,在给定关联文本的图像中定位视觉概念;2)同时,通过对比损失、匹配损失和掩码语言建模损失,将文本与视觉概念进行多粒度对齐。
在微调和推理中,X-VLM可以利用学习到的多粒度对齐来执行下游的V+L任务,而无需在输入图像中添加边框注释。
论文链接:
https://arxiv.org/abs/2111.08276
WeNet是一个面向生产的端到端语音识别工具包,在单个模型中,它引入了统一的两次two-pass (U2) 框架和内置运行时来处理流式和非流式解码模式。
就在今年7月初的时候,WeNet推出2.0版本,并在4个方面进行了更新:
U2++:具有双向注意力解码器的统一双通道框架,包括从右到左注意力解码器的未来上下文信息,以提高共享编码器的表示能力和重新评分阶段的性能;
引入了基于n-gram的语言模型和基于WFST的解码器,促进了富文本数据在生产场景中的使用;
设计了统一的上下文偏置框架,该框架利用用户特定的上下文为生产提供快速适应能力,并在“有LM”和“无LM”两大场景中提高ASR准确性;
设计了一个统一的IO来支持大规模数据进行有效的模型训练。
从结果上看,WeNet 2.0在各种语料库上比原来的WeNet实现了高达10%的相对识别性能提升。
论文链接:https://arxiv.org/pdf/2203.15455.pdf
STARK是一种用于视觉跟踪的时空变换网络。基于由卷积主干、编解码器转换器和bounding box预测头组成的baseline的基础上,STARK做了3点改进:
动态更新模板:以中间帧作为动态模板加入输入中。动态模板可捕获外观变化,提供额外时域信息;
score head:判断当前是否更新动态模板;
训练策略改进:将训练分为两个阶段1)除了score head外,用baseline的损失函数训练。确保所有搜索图像包含目标并让模板拥有定位能力;2)用交叉熵只优化score head,此时冻结其他参数,以此让模型拥有定位和分类能力。
论文链接:
https://openaccess.thecvf.com/content/ICCV2021/papers/Yan_Learning_Spatio-Temporal_Transformer_for_Visual_Tracking_ICCV_2021_paper.pdf
今天关于《光动嘴就能玩原神!用AI切换角色,还能攻击敌人,网友:“绫华,使用神里流·霜灭”》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

- 上一篇
- 关于ChatGPT八个技术问题的猜想

- 下一篇
- 中国人工智能软件市场指南
-
- 长情的钢笔
- 这篇文章内容真及时,太全面了,很好,收藏了,关注大佬了!希望大佬能多写科技周边相关的文章。
- 2023-06-24 17:39:33
-
- 英俊的玉米
- 感谢大佬分享,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢楼主分享文章!
- 2023-05-01 21:26:52
-
- 风中的夕阳
- 太全面了,mark,感谢大佬的这篇文章内容,我会继续支持!
- 2023-04-29 04:39:24
-
- 科技周边 · 人工智能 | 2小时前 |
- 豆包AI编程教程代码生成实战攻略
- 113浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 豆包AI代码生成教程豆包编程使用指南
- 401浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- BigDL入门:分布式AI训练指南
- 114浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 豆包账号注册与登录全攻略
- 335浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 豆包AI模板库!00后沙雕图生成攻略
- 245浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 拼多多商家必备:DeepSeek话术生成教程
- 416浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 小米鸿蒙零跑订单爆,新势力创纪录
- 294浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 豆包AI能设计珠宝吗?3D建模工具测评
- 346浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- AI工具与豆包协作优化全攻略
- 380浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 豆包AI编程教程:手把手教你写程序
- 127浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 509次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 边界AI平台
- 探索AI边界平台,领先的智能AI对话、写作与画图生成工具。高效便捷,满足多样化需求。立即体验!
- 218次使用
-
- 免费AI认证证书
- 科大讯飞AI大学堂推出免费大模型工程师认证,助力您掌握AI技能,提升职场竞争力。体系化学习,实战项目,权威认证,助您成为企业级大模型应用人才。
- 241次使用
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 357次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 441次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 378次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览