语音助手好吗?好,但还不够好
一分耕耘,一分收获!既然都打开这篇《语音助手好吗?好,但还不够好》,就坚持看下去,学下去吧!本文主要会给大家讲到等等知识点,如果大家对本文有好的建议或者看到有不足之处,非常欢迎大家积极提出!在后续文章我会继续更新科技周边相关的内容,希望对大家都有所帮助!
译者 | 布加迪
审校 | 千山
日前美国《商业内幕》杂志报道称,亚马逊的语音助手Alexa及智能音箱业务将亏损100亿美元。就在这个消息发布之际,Alexa的竞争对手同样面临各自的难关,竭力寻找使语音助手赚钱的法子。
Alexa及其他语音助手的现状提醒我们,研发出色技术与依托技术赚钱存在着差距。科技公司忙于裁员,准备迎接即将到来的经济衰退,新潮但不盈利的技术将不得不设法展示其价值,否则将被企业淘汰,以维持生存。
亚马逊Alexa推出八年后,我们可以从语音助手这项技术和这块业务中学到以下几点。
1、技术是好,但还不够好
许多创新使亚马逊Alexa之类的语音助手能够完成十多年前不可能完成的任务。自动语音识别领域的进步帮助助手在不同的背景噪声条件下,面对其他干扰声音和用户的不同口音,拾取和分析用户的声音。基于Transformer、RNN和LSTM等深度神经网络支持的自然语言处理系统帮助助手将细微差异的不同语音与相应的命令对应起来,想象一下你能以种种不同方式来询问天气或请求定时。现在有许多应用程序平台和API让语音助手可以遍历网络上的大量信息,并将语音命令与应用程序功能对应起来。
然而,如今语音助手的功能有限。总体上来说,亚马逊Alexa只能执行一些简单的任务,比如定时、播放音乐、查询天气以及在网上搜索简单信息。
这些任务要么非常狭窄,没有太多的出错余地,要么不敏感,即使助手出错也不会造成太大的危害。
一旦你想要执行敏感的、需要多次交互或本质上多模态的任务,语音助手会变得不靠谱。以购物为例,这是亚马逊最初为Alexa规划的重要用途之一。这是一种敏感的任务,因为它涉及钱财,用户希望错误尽量少点。这也是一种复杂的任务,因为它通常需要多个步骤,用户希望看到所购买的产品,希望能够浏览购买建议和替代产品。很难用纯语音界面来实现这一点,安排会议之类的其他任务也存在同样的情况。
2、人们为什么掏钱?
你已研制出一款很酷的语音助手,能够相当准确地执行一系列任务,其他助手较为逊色。如何使其赚钱?鉴于当前的应用,有几个解决办法。
第一个解决办法是销售硬件,比如不同版本的亚马逊Echo、苹果HomePod或谷歌Nest智能音箱。在这种情况下,商业价值将与设备的价格、销售的设备数量以及客户更换设备的频次挂钩。这种办法适用于智能手机,因为人们每过几年就花几百美元来升级iPhone或Pixel手机,但不适用于智能音箱。首先,人们不愿意为此支付很高的溢价,因为他们不经常使用这种设备。其次,智能音箱没有太多需要升级的地方,它基本上就是一个麦克风和一个扬声器,有时还附带屏幕。因此,客户没有理由定期更换它们。最后,升级和维护支持语音助手的云服务需要收费。因此,大致说来,持续使用智能音箱会增加智能音箱厂商的成本,最终这些成本会超过销售音箱的利润。
第二个解决办法是销售服务。在这种情况下,用户按月或按年付费,以便使用手机或智能音箱上的语音助手。在这种情况下,你的产品必须有足够的价值,让用户愿意为它掏钱。这种商业模式要想成功,你的产品必须解决某个悬而未决的问题,或者创造足够的附加值来说服用户为其付费,从而达到产品/市场契合。遗憾的是,亚马逊Alexa及其他语音助手所完成的任务具有的价值还不足以让用户付费。
最后,你可以把亚马逊Alexa看作是吸引用户使用其他赚钱产品的渠道。比如说,亚马逊认为Alexa会让用户更频繁地网购。但由于前面提到的局限性,Alexa并未提供一种很好的购物体验,用户依然青睐使用手机或Web应用程序来购物。
基本上这回到了开头所说的。从科学和工程的角度来看,亚马逊Alexa确实很出色。但从产品和业务的角度来看,它并不具备赚钱的要素。
3、下一代语音助手?
第一代语音助手提出了很好的想法(使用语音作为与计算机交互的接口),但未能打造一种有利可图的商业模式。我们已经在上世纪90年代的VR头戴设备(价格太高、质量太低)和2010年代初的AR眼镜(眼镜没有提供足够的附加值来证明其价位合理)上看到过这种情况。Alexa和Siri依然热销,因为它们是由财大气粗的公司开发的,在正常的市场环境下,这些公司能够承受新产品亏损的现状,直至它们找到商业模式(或砍掉新产品)。
语音助手的下一步会是什么?我看到了几条出路。
一个解决办法是等人工智能技术变得非常好,它可以支持完全不同的应用(比如说语音助手总是领先一步,主动与你联系,而不是由你来激活它?)
另一个解决办法是从当前通用语音助手的模式转向可以适应不同应用的更垂直的专业化的助手。这将使语音助手能够集成到各种应用的上下文和工作流程中,使它们完全能够处理复杂的多步骤任务。我认为这种形式可能会有切实可行的B2B商业模式,尤其是在涉及大量手动操作的行业(制造业、餐厅和酒店等),毕竟语音助手可以提高效率,降低成本。对企业而言的附加值将远远压倒消费者使用手机通话获得的便利(就像第二代谷歌眼镜在手工品行业找到了产品/市场契合)。
我不确定无屏幕的智能音箱最终是否会成为未来语音助手的合适样式。我们的许多日常任务涉及到视觉元素,纯语音助手的用途将很有限,这方面会有怎样的结果值得拭目以待。
亚马逊目前还没有计划砍掉Alexa,但我认为也许是时候转向下一代语音助手了。
原文链接:https://bdtechtalks.com/2022/11/28/amazon-alexa-revenue/
终于介绍完啦!小伙伴们,这篇关于《语音助手好吗?好,但还不够好》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

- 上一篇
- 靠AI六小时搞出蝙蝠侠动画电影,小哥喜提百万浏览量

- 下一篇
- 争取盟友、洞察人心,最新的Meta智能体是个谈判高手
-
- 懦弱的睫毛膏
- 这篇技术文章真及时,太全面了,很棒,码起来,关注作者了!希望作者能多写科技周边相关的文章。
- 2023-07-08 17:27:12
-
- 整齐的白云
- 受益颇多,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢楼主分享技术贴!
- 2023-06-09 15:11:31
-
- 科技周边 · 人工智能 | 5小时前 |
- Linux服务器时间校对命令详解及应用
- 420浏览 收藏
-
- 科技周边 · 人工智能 | 6小时前 | 量子计算 营收 skywater 第一季度 ThermaView
- SkyWaterQ1营收6130万,强势新平台吸睛
- 293浏览 收藏
-
- 科技周边 · 人工智能 | 6小时前 |
- 问界新M7牧野青发布颜值爆表24.98万起
- 416浏览 收藏
-
- 科技周边 · 人工智能 | 6小时前 |
- 2024财年车企净利润榜:丰田居首,小米排15
- 426浏览 收藏
-
- 科技周边 · 人工智能 | 7小时前 | 开源 国产品牌 5G手机 电子信息制造业 软件及信息技术服务业
- 工信部数据:1-2月5G手机出货4161.9万,国产占85%
- 289浏览 收藏
-
- 科技周边 · 人工智能 | 12小时前 | 面板 lge
- LG东南亚工厂暂停,北美成新重心
- 487浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 毕业宝AIGC检测
- 毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
- 23次使用
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 33次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 30次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 34次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 36次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览