当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 语音助手好吗?好,但还不够好

语音助手好吗?好,但还不够好

来源:51CTO.COM 2023-04-13 14:36:28 0浏览 收藏

一分耕耘,一分收获!既然都打开这篇《语音助手好吗?好,但还不够好》,就坚持看下去,学下去吧!本文主要会给大家讲到等等知识点,如果大家对本文有好的建议或者看到有不足之处,非常欢迎大家积极提出!在后续文章我会继续更新科技周边相关的内容,希望对大家都有所帮助!

​译者 | 布加迪

审校 | 千山

日前美国《商业内幕》杂志报道称,亚马逊的语音助手Alexa及智能音箱业务将亏损100亿美元。就在这个消息发布之际,Alexa的竞争对手同样面临各自的难关,竭力寻找使语音助手赚钱的法子。

Alexa及其他语音助手的现状提醒我们,研发出色技术与依托技术赚钱存在着差距。科技公司忙于裁员,准备迎接即将到来的经济衰退,新潮但不盈利的技术将不得不设法展示其价值,否则将被企业淘汰,以维持生存。

亚马逊Alexa推出八年后,我们可以从语音助手这项技术和这块业务中学到以下几点。

1、技术是好,但还不够好

许多创新使亚马逊Alexa之类的语音助手能够完成十多年前不可能完成的任务。自动语音识别领域的进步帮助助手在不同的背景噪声条件下,面对其他干扰声音和用户的不同口音,拾取和分析用户的声音。基于Transformer、RNN和LSTM等深度神经网络支持的自然语言处理系统帮助助手将细微差异的不同语音与相应的命令对应起来,想象一下你能以种种不同方式来询问天气或请求定时。现在有许多应用程序平台和API让语音助手可以遍历网络上的大量信息,并将语音命令与应用程序功能对应起来。

然而,如今语音助手的功能有限。总体上来说,亚马逊Alexa只能执行一些简单的任务,比如定时、播放音乐、查询天气以及在网上搜索简单信息。

这些任务要么非常狭窄,没有太多的出错余地,要么不敏感,即使助手出错也不会造成太大的危害。

一旦你想要执行敏感的、需要多次交互或本质上多模态的任务,语音助手会变得不靠谱。以购物为例,这是亚马逊最初为Alexa规划的重要用途之一。这是一种敏感的任务,因为它涉及钱财,用户希望错误尽量少点。这也是一种复杂的任务,因为它通常需要多个步骤,用户希望看到所购买的产品,希望能够浏览购买建议和替代产品。很难用纯语音界面来实现这一点,安排会议之类的其他任务也存在同样的情况。

2、人们为什么掏钱?

你已研制出一款很酷的语音助手,能够相当准确地执行一系列任务,其他助手较为逊色。如何使其赚钱?鉴于当前的应用,有几个解决办法。

第一个解决办法是销售硬件,比如不同版本的亚马逊Echo、苹果HomePod或谷歌Nest智能音箱。在这种情况下,商业价值将与设备的价格、销售的设备数量以及客户更换设备的频次挂钩。这种办法适用于智能手机,因为人们每过几年就花几百美元来升级iPhone或Pixel手机,但不适用于智能音箱。首先,人们不愿意为此支付很高的溢价,因为他们不经常使用这种设备。其次,智能音箱没有太多需要升级的地方,它基本上就是一个麦克风和一个扬声器,有时还附带屏幕。因此,客户没有理由定期更换它们。最后,升级和维护支持语音助手的云服务需要收费。因此,大致说来,持续使用智能音箱会增加智能音箱厂商的成本,最终这些成本会超过销售音箱的利润。

第二个解决办法是销售服务。在这种情况下,用户按月或按年付费,以便使用手机或智能音箱上的语音助手。在这种情况下,你的产品必须有足够的价值,让用户愿意为它掏钱。这种商业模式要想成功,你的产品必须解决某个悬而未决的问题,或者创造足够的附加值来说服用户为其付费,从而达到产品/市场契合。遗憾的是,亚马逊Alexa及其他语音助手所完成的任务具有的价值还不足以让用户付费。

最后,你可以把亚马逊Alexa看作是吸引用户使用其他赚钱产品的渠道。比如说,亚马逊认为Alexa会让用户更频繁地网购。但由于前面提到的局限性,Alexa并未提供一种很好的购物体验,用户依然青睐使用手机或Web应用程序来购物。

基本上这回到了开头所说的。从科学和工程的角度来看,亚马逊Alexa确实很出色。但从产品和业务的角度来看,它并不具备赚钱的要素。

3、下一代语音助手?

第一代语音助手提出了很好的想法(使用语音作为与计算机交互的接口),但未能打造一种有利可图的商业模式。我们已经在上世纪90年代的VR头戴设备(价格太高、质量太低)和2010年代初的AR眼镜(眼镜没有提供足够的附加值来证明其价位合理)上看到过这种情况。Alexa和Siri依然热销,因为它们是由财大气粗的公司开发的,在正常的市场环境下,这些公司能够承受新产品亏损的现状,直至它们找到商业模式(或砍掉新产品)。

语音助手的下一步会是什么?我看到了几条出路。

一个解决办法是等人工智能技术变得非常好,它可以支持完全不同的应用(比如说语音助手总是领先一步,主动与你联系,而不是由你来激活它?)

另一个解决办法是从当前通用语音助手的模式转向可以适应不同应用的更垂直的专业化的助手。这将使语音助手能够集成到各种应用的上下文和工作流程中,使它们完全能够处理复杂的多步骤任务。我认为这种形式可能会有切实可行的B2B商业模式,尤其是在涉及大量手动操作的行业(制造业、餐厅和酒店等),毕竟语音助手可以提高效率,降低成本。对企业而言的附加值将远远压倒消费者使用手机通话获得的便利(就像第二代谷歌眼镜在手工品行业找到了产品/市场契合)。

我不确定无屏幕的智能音箱最终是否会成为未来语音助手的合适样式。我们的许多日常任务涉及到视觉元素,纯语音助手的用途将很有限,这方面会有怎样的结果值得拭目以待。

亚马逊目前还没有计划砍掉Alexa,但我认为也许是时候转向下一代语音助手了。

原文链接:https://bdtechtalks.com/2022/11/28/amazon-alexa-revenue/

终于介绍完啦!小伙伴们,这篇关于《语音助手好吗?好,但还不够好》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
靠AI六小时搞出蝙蝠侠动画电影,小哥喜提百万浏览量靠AI六小时搞出蝙蝠侠动画电影,小哥喜提百万浏览量
上一篇
靠AI六小时搞出蝙蝠侠动画电影,小哥喜提百万浏览量
争取盟友、洞察人心,最新的Meta智能体是个谈判高手
下一篇
争取盟友、洞察人心,最新的Meta智能体是个谈判高手
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    191次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    191次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    190次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    195次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    212次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码