MLOps:企业是否在重复同样的 DIY 错误?
大家好,今天本人给大家带来文章《MLOps:企业是否在重复同样的 DIY 错误?》,文中内容主要涉及到,如果你对科技周边方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!
译者 | 崔皓
审校 | 孙淑娟
开篇

一般而言,企业不会主动构建自有的云计算基础设施是有原因的。过去十年,IT 基础架构团队试图构建自己的私有云,因为他们认为与公共云相比,私有云会以性价比更高的方式支撑他们的业务。但事与愿违,最终花费在私有云上的的时间和成本都超过了预期,建成私有云以后反而需要更多的资源来对其进行维护,并且在安全和扩展方面都比公共云略逊一筹。这导致那些自建私有云的企业最终没有更多的资源投资于核心业务,而是将大量的时间和人员投入到无法扩展业务需求的基础设施上。
现在,许多企业通过各种开源工具(如 Apache Spark)生成解决方案,但对于 MLOps 的大多数行为都需要进行重复地手动操作。
这会导致模型部署需要数周甚至数月的时间、低效的运行时间(通过计算和所需时间运行的推理来衡量),同时还缺乏对模型测试和监控的观察。并且,所用方法过于定制化,无法为企业的不同部门的多个用例提供可扩展、可复用的业务流程。
误诊问题的案例
此外,通过与业务线负责人、首席数据分析官的对话得出这样的结论,虽然组织雇用了很多的数据科学家,但并没有看到任何回报。随着研究的深入,他们会不断提出各种问题,通过这些问题去识别人工智能面临的困难和障碍。他们很快意识到关键问题在“最后一英里”——部署模型并应用于实时数据,有效地执行它们,这样一来才能使收益大于成本,从而更好地衡量其性能。
为了解决业务问题和制定业务决策,数据科学家将数据转化为模型。这一过程需要两类技能的支持,其一是,构建出色模型所需的专业知识和技能;其二是,使用代码在现实世界中推动模型,同时监控和更新模型的技能。然而这两类技能却完全不同。
正因为这种差异就有了ML 工程师的用武之地。ML 工程师负责将工具和框架进行集成,以确保数据、管道和基础设施协同工作,在此前提下大规模生产 ML 模型。
那么,现在怎么办?雇用更多的机器学习工程师?
即使拥有最好的 ML 工程师,企业在扩展 AI 时仍面临两个主要问题:
- 无法快速雇用 ML 工程师:对 ML 工程师的需求变得非常强烈,ML 工程师的职位空缺增长速度比 IT 服务增长的速度快了 30 倍。有时需要等待数月甚至数年来填补岗位空缺,由此MLOps 团队需要找到一种高效的方式支持更多的 ML 模型和用例,而无需通过增加 ML 工程师的人数来满足对ML应用的需求。但这一措施又会带来了第二个瓶颈……
- 无论在何处以及如何构建模型,都缺乏部署模型的可重复、可扩展的最佳实践:现代企业数据生态系统的现状是,不同的业务部门根据数据和技术的要求会使用不同的数据平台(例如,产品团队可能需要支持流数据,而财务需要为非技术用户提供简单的查询界面)。此外,数据科学还需要将应用分散到各个业务部门而不是集中应用。换句话说,不同的数据科学团队中针对他们关注的用例(领域)都有一套特有的模型训练框架,这意味着一刀切的训练框架针对整个企业(包含多个部门/领域)而言是无法成立的。
如何从人工智能中获得最大价值
为了提高自动化能力;为了提供大规模的用户个性化体验;为了兑现更准确、更精细、可预测的用户承诺,企业已经向人工智能投入了数十亿美元。但到目前为止,人工智能的承诺和结果之间存在巨大差距,只有大约 10%的人工智能投资产生了可观的投资回报率。
最后,为了解决 MLOps 问题,首席数据分析官需要围绕业务核心的数据科学构建自己的能力,同时也要投资其他的与 MLOps自动化相关的技术。这是常见的“构建与购买”困境,不仅从运营的角度(成本收益)去考量,更多地需要考虑人工智能投资在整个企业中渗透的速度和效率,以及是否通过更好的方式产生新的收入产品和客户群,或通过提高自动化程度和减少浪费来削减成本。
译者介绍
崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验。曾任惠普技术专家。乐于分享,撰写了很多热门技术文章,阅读量超过60万。《分布式架构原理与实践》作者。
原文标题:MLOps | Is the Enterprise Repeating the Same DIY Mistakes?
文中关于人工智能,机器学习,云计算的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《MLOps:企业是否在重复同样的 DIY 错误?》文章吧,也可关注golang学习网公众号了解相关技术文章。
谷歌科学家亲讲:具身推理如何实现?让大模型「说」机器人的语言
- 上一篇
- 谷歌科学家亲讲:具身推理如何实现?让大模型「说」机器人的语言
- 下一篇
- 这只线虫不简单!大脑被高精度还原,可动态蠕动前行
-
- 科技周边 · 人工智能 | 45分钟前 |
- 文心一言登录入口及账号使用教程
- 378浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- Perplexity论文写作与引用技巧全解析
- 406浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | Http请求 API密钥 API调用 ZeroGPTAPI AI内容识别
- ZeroGPTAPI调用方法及接口教程
- 113浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- AIOverviews自定义设置教程
- 190浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 | 核心功能 登录方式 DeepSeekAI 平台入口 交互技巧
- DeepSeekAI平台入口与使用教程
- 218浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- ChatGPT助力数字博物馆展陈创新
- 273浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 3210次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 3424次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 3453次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 4561次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 3831次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览

