加速AI开发,企业如何利用MLOps提升生产效率?
今日不肯埋头,明日何以抬头!每日一句努力自己的话哈哈~哈喽,今天我将给大家带来一篇《加速AI开发,企业如何利用MLOps提升生产效率?》,主要内容是讲解等等,感兴趣的朋友可以收藏或者有更好的建议在评论提出,我都会认真看的!大家一起进步,一起学习!

企业第一次部署人工智能和构建机器学习项目的时候,往往把重点放在理论上。那么有没有一种模型,可以提供必要的结果?如果有,我们又该如何构建和训练这种模型呢?
根据IDC的数据显示,部署人工智能或者机器学习解决方案平均需要长达9个多月的时间。主要是因为数据科学家用来打造这些概念证明的工具,通常不能很好地转化为生产系统。IDC分析师SriramSubramanian说:“我们将研发的过程所需的时间称为‘模型速度’,即从开始到结束需要多长时间。”
企业可以利用MLOps解决上述问题。MLOps(Machine Learning Operations)是一组最佳实践、框架和工具,可以帮助企业管理数据、模型、部署、监控,以及其他利用理论概念验证AI系统并使之奏效的方方面面。
Subramanian进一步解释,“MLOps将模型速度缩短到几周——有时甚至是几天,就像使用DevOps加快应用构建的平均时间一样,这就是为什么你需要MLOps。”企业通过采用MLOps可以构建更多模型、更快地创新、应对更多的使用场景。“MLOps的价值定位很明确。”
据IDC预测,到2024年将有60%的企业使用MLOps来实施他们的机器学习工作流。Subramanian说,当他们对受访者调查采用人工智能和机器学习的挑战时,最主要的障碍之一就是缺少MLOps,仅次于成本。
在本文中,我们研究了MLOps是什么,如何演变的,以及企业组织需要完成和牢记什么,才能充分利用这种新兴的人工智能操作方法。
MLOps的演进
几年前,当Eugenio Zuccarelli首次开始构建机器学习项目的时候,MLOps还只是一组最佳实践。从那时起,Zuccarelli一直在多家企业从事人工智能项目,包括医疗和金融服务领域的企业,他看到,随着时间的推移MLOps开始发展到包含了各种工具和平台。
如今,MLOps为人工智能操作提供了一个相当强大的框架,Zuccarelli说,他现在是CVS Health的创新数据科学家,他提到了之前从事的一个项目,该项目旨在创建一个可以预测不良结果的应用,例如再入院或疾病进展。
“我们正在探索数据集和模型,并与医生进行沟通找出最佳模型所具备的特征。但要使这些模型真正有用,还需要让用户真正地用起这些模型。”
这意味着要打造一个可靠的、快速且稳定的移动应用,后端有一个通过API连接的机器学习系统。他说:“如果没有MLOps,我们将无法确保这一点。”
他的团队使用H2O MLOps平台和其他工具为模型创建了健康仪表板。“你肯定不希望模型发生重大变化,也不想引入偏见。健康仪表板让我们能够了解系统是否发生了变化。”
通过使用MLOps平台还可以对生产系统进行更新。他说:“在不停止应用工作的情况下换出文件是非常困难的。而MLOps可以在生产进行中、以系统影响最小的情况下换出系统。”
他说,MLOps平台随着逐渐成熟将会加速整个模型开发的过程,因为企业不必为每个项目都重新发明框架。数据管道管理功能对于人工智能的实施也至关重要。
“如果我们有多个需要相互通信的数据源,这时候MLOps就可以发挥作用了。你希望流入机器学习模型的所有数据都是一致的且高质量的。就像那句话说的,垃圾进,垃圾出。如果模型的信息很差,那么预测本身就会很差。”
MLOps的基础:一个不断变化中的目标
但不要认为,仅仅因为有那么多可用的平台和工具,就忽略了MLOps的核心原则。刚开始使用MLOps的企业应该记住,MLOps的核心是在数据科学和数据工程之间建立牢固的联系。
Zuccarelli说:“为了确保MLOps项目的成功,你需要数据工程师和数据科学家是在同一个团队内工作的。”
此外,防止偏见、确保透明度、提供可解释性以及支持道德平台所必需的工具,都还在开发之中,“这方面肯定还需要做很多工作,因为这是一个非常新的领域。”
因此,如果没有一个完整的交钥匙型解决方案可供采用,企业就必须非常了解如何让MLOps有效地实施人工智能的方方面面。这就意味着,要广泛地培养专业技能,技术咨询公司Insight的人工智能团队国家实践经理Meagan Gentry这样表示。
MLOps涵盖了从数据收集、验证和分析、到管理机器资源和追踪模型性能的整个范畴,有很多辅助工具是可以部署在本地、云端或者在边缘的,这些工具有的是开源的,有的是专属的。
但掌握技术只是其中一个方面,MLOps还借鉴了DevOps的敏捷方法和迭代开发的原则,Gentry说。此外,和任何敏捷相关的领域一样,沟通是至关重要的。
“每个角色的沟通都是很重要的,数据科学家和数据工程师之间的沟通,和DevOps的沟通,以及和整个IT团队的沟通。”
对于刚起步的公司来说,MLOps可能是令人困惑的,它有很多一般性原则,有几十家相关厂商,甚至还有非常多的开源工具集。
“这时候会遇到各种陷阱,”Capgemini Americas企业架构高级经理Helen Ristov说。“其中很多都还在开发中,现在还没有一套正式的指导方针,就像DevOps一样,这还是一项新兴技术,指导方针和相关政策需要一定时间才能推出。”
Ristov建议,企业应该从数据平台开始他们的MLOps之旅。“也许他们有数据集,但是这些数据集是在不同地方的,没有一个统一的环境。”
她说,企业不需要将所有数据转移到一个平台上,但确实需要一种方法从不同的数据源中引入数据,不同的应用,情况也各不相同。例如,数据湖非常适合那些以高频次进行大量分析、低成本存储的企业。MLOps平台通常有用于构建和管理数据管道并跟踪不同版本的训练数据工具,但这并不是一劳永逸的。然后是模型创建、版本控制、日志记录、衡量功能集、管理模型本身等其他方面。
“其中涉及大量的编码工作,”Ristov说,建立一个MLOps平台可能需要数月时间,而且在集成方面,平台供应商还有很多的工作要做。
“这些不同方向还有很大的发展空间,很多工具还在开发之中,生态系统非常庞大,人们只是选择他们所需的东西。MLOps还处于‘青春期’,大多数企业组织仍在寻找最理想的配置。”
MLOps的市场格局
IDC的Subramanian表示,MLOps市场规模预计将从2020年的1.85亿美元增长到2025年约7亿美元,但这个市场也有可能被严重低估了,因为MLOps产品通常与更大的平台捆绑在一起。他说,到2025年MLOps市场的真实规模可能超过20亿美元。
Subramanian说,MLOps厂商供应商往往分为三大类,首先是大型云提供商,例如AWS、Azure和Google Cloud,这种厂商是把MLOps功能作为一项服务提供给客户。
第二类是机器学习平台厂商,例如DataRobot、Dataiku、Iguazio等。
“第三类是过去所说的数据管理厂商,例如Cloudera、SAS和DataBricks等等。他们的优势在于数据管理能力和数据操作,然后扩展到机器学习能力,最终延伸到MLOps能力。”
Subramanian说,这三个领域都呈现出爆炸式增长,能让MLOps厂商脱颖而出的,是他们能否同时支持本地环境和云部署模型,是否能够实施可信的、负责任的人工智能,是否即插即用,是否容易扩展,这就是体现差异化的方面。”
根据IDC最近的一项调查显示,缺乏实施负责任AI的各种方法,是阻碍人工智能和机器学习普及的三大障碍之一,与缺乏MLOps一起并列第二。造成这种情况很大程度上是因为除了采用MLOps别无他选,Gartner人工智能和机器学习研究分析师Sumit Agarwal这样表示。
“其他方法都是手动的,所以,真的没有其他选择了。如果你想扩展的话,你需要自动化。你需要代码、数据以及模型的可追溯性。”
根据Gartner最近的一项调查显示,一个模型从概念验证到生产所需的平均时间已经从9个月缩短到7.3个月。“但是7.3个月时间仍然很长,企业组织有很多机会利用MLOps。”
MLOps带来的企业文化变革
Genpact公司全球分析负责人Amaresh Tripathy表示,实施MLOps还需要以企业AI团队的身份掀起一场文化变革。
“数据科学家给人们的印象通常是一个疯狂的科学家,试图大海捞针。但实际上数据科学家是发现者和探索者,而不是生产小部件的工厂。”企业经常低估自身所需要付出的努力。
“人们能更好地理解工程,对用户体验有这样那样的要求,但不知道为什么,人们对部署模型却完全不同。人们会假设所有擅长测试环境的数据科学家自然都会部署这些模型,或者可以派几个IT员工来部署,这是错误的。人们并不了解他们需要什么。”
很多企业也并不知道MLOps可能会给企业内部其他方面带来哪些连锁反应,因此经常导致企业内部发生巨大的变化。
“你可以把MLOps放在呼叫中心,平均响应时间实际上会增加,因为简单的事情交给了机器和人工智能来处理,而交给人类做的事情实际上需要更长的时间,因为这些事情往往更复杂。所以你需要重新考虑这些工作是什么,你需要什么样的人,这些人应该具备什么样的技能。”
Tripathy表示,如今,一个企业组织中只有不到5%的决策是由算法驱动的,但这种情况正在迅速变化。“我们预计未来五年,将有20%到25%的决策是由算法驱动的,我们看到的每一个统计数据都表明,我们处于人工智能快速扩展的拐点上。”
他认为,MLOps是关键的一个部分。如果没有MLOps,你就无法始终如一地使用人工智能。MLOps是企业AI规模化的催化剂。
理论要掌握,实操不能落!以上关于《加速AI开发,企业如何利用MLOps提升生产效率?》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
人工智能在建筑行业的应用
- 上一篇
- 人工智能在建筑行业的应用
- 下一篇
- 一文读懂自动驾驶雷达传感器应用设计方案
-
- 科技周边 · 人工智能 | 6分钟前 |
- 多模态AI提升图像识别速度方法
- 159浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | Notion数据库 Relation字段 Rollup字段 Lookup字段 InlineRelation视图
- Notion数据库怎么关联?多库关系设置教程
- 301浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 贾跃亭:FF将与特斯拉合作FSD技术
- 409浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 | AdobeFirefly 风格关键词 形状提示 图像补缺 几何形状
- AdobeFirefly形状补缺技巧分享
- 403浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 | AI工具 ai怎么裁剪图片
- XnViewAI裁剪教程详解与技巧
- 281浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 3201次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 3414次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 3444次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 4552次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 3822次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览

