当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 工业AI也将迎来「ChatGPT时刻」

工业AI也将迎来「ChatGPT时刻」

来源:51CTO.COM 2023-04-14 12:04:04 0浏览 收藏

大家好,我们又见面了啊~本文《工业AI也将迎来「ChatGPT时刻」》的内容中将会涉及到等等。如果你正在学习科技周边相关知识,欢迎关注我,以后会给大家带来更多科技周边相关文章,希望我们能一起进步!下面就开始本文的正式内容~

基于单模态 GPT-3 的 ChatGPT 「地震」余波未平,多模态 GPT-4「海啸」又顷刻席卷朋友圈。

「这提醒我们,对人工智能的预测是非常困难的。」OpenAI CEO Sam Altman 曾在 DALL-E 2 发布后讲过这样一句话。事实证明他是对的。基于符号主义的专家系统的衰落,让人们一度认为人工智能已走到尽头,2012 年的深度学习又点燃了希望,如今它已统领 AI 领域。随着系统规模越来越大,训练时间和资金成本也在不断膨胀。就在大家担心向模型添加参数正达到边际效益递减时,GPT-3、GPT-4 相继昭告世人,更大规模、更加复杂的深度学习系统确实可以释放更为惊人的能力,而 ChatGPT 的诞生,更是让人看到了「颠覆性」的应用成果(假消息甚至称GPT4参数量100万亿)。

图片

ChatGPT 的出现或许表明,在过去几年被逐渐认为到达产业化瓶颈的 AI 行业仍是一片最具创新性的沃土,蕴含着巨大的机会。而随着新生产力初显雏形,以工业制造为代表的行业或许将迎来更深入的 AI 变革,迎来属于产业的 “ChatGPT 时刻”,在这一过程中与技术趋势契合的科技企业也有望率先出圈。

一、通用性的胜利

迄今为止,主导 AI 领域的模型仍然是面向特定任务的。AI 企业开发的模型在特定范围内有不错的表现,但工程师们发现其泛化能力不足以支持部署到更广泛场景。用业内人士的话说,已经训练了很多模型,但仍然需要茫茫多的模型。

这一瓶颈在高度碎片化工业制造领域几乎被 N 倍放大。因为工业制造中细分领域众多,各领域在生产流程、工艺、生产线配置、原材料及产品类型上均具有较大差异性。锂电池生产可分为十几道工序,工艺点数以千计,一条产线至少有 2500 个关键的质量控制点;液晶面板生产涉及上百道工序,生产过程中可能出现的面板缺陷种类多达 120 种;手机有几百种零件,涉及几百个供应商,每个零件可能有几十种缺陷要做检测。

现有的深度学习模型泛化程度低,即使在同一行业,模型的可复用比例也比较低。比如,如果要服务一家全球领先的手机品牌的整个智能产线,可能需要打造几十万个算法模型(不包括后续软硬件的迭代升级)。

现在,这个棘手的问题成了 ChatGPT 背后所代表的基础模型(大模型)的典型场景。

在 2022 年,一篇来自谷歌、斯坦福大学、北卡罗来纳大学教堂山分校以及 DeepMind 等机构的研究论文 [1],介绍了大模型的「Emergent Ability(突现能力)」,即有些现象不存在于较小的模型中但存在于较大的模型中,他们认为模型的这种能力是突现的。虽然这种能力目前主要体现在语言模型上,但它也激发了在视觉模型、多模态模型上未来的研究。

根据斯坦福大学以人为本人工智能中心(HAI)基础模型研究中心(CRFM)的说法,「它(大模型)代表着构建 AI 系统的一种新的成功范式,在大量数据上训练一个模型,并使其适应多种应用」[2]。

这种通用能力正是工业制造所需要的。工业制造面对的场景五花八门,如何通过稳定的技术体系,在高度碎片化的需求中打造通用的技术能力,成为任何一家试图在此大展身手的科技企业的最大挑战。

思谋科技创始人贾佳亚在公司成立之初曾提到 AI 2.0 概念,其与在当下广泛采用 AI 1.0 的 AI 公司有所区别的一个核心要点,就是对通用性的强调。「我们想做新一代的 AI 体系架构,把以前别人在单个场景做的事情,用统一的架构去解决它,在不同场景里做到通用」,贾佳亚说,「从底层构建更智能的算法,用标准化的手段解决分散的工业场景,克服可复制性和标准性等关键性问题。」

思谋科技最受欢迎的产品 SMore ViMo 工业平台,就是通用性设计思维的典型例子,它是针对工业场景打造的首个跨行业中枢平台,具有多场景通用性。不仅满足新能源、半导体、汽车、消费电子等多个行业领域超过 1000 种细分应用场景需求,还灵活支持多种高难度工业视觉方案设计需求,比如产线的物料追踪、缺陷定位、工件计数、外观瑕疵检测等等。

图片

SMore ViMo 智能工业平台的系统架构。

这条路的重要特点是比较好地平衡了敏捷、个性化与低边际成本。借助 SMore ViMo 平台,思谋科技已经可以同时支撑工业中不同行业的上百个项目,未来还有望再扩大十倍,同时支撑上千个项目,为 AI 的行业应用带来效率上的突破。

在率先于大规模工业场景使用 Transformer 技术,极大提高智能制造效率之后,思谋也再次第一时间拥抱大模型。思谋团队是最早对大模型在工业领域的 Emergent Ability 开展研究和产业化的团队,其工业大模型利用少量缺陷样本进行 in-context learning,从而使基础模型快速适应特定工业场景,并完成特定任务。

在一些业内人士看来,ChatGPT 及其背后更加具有通用性的技术的成功,将推动 AI 应用进入一个新的阶段。在以工业制造为代表的各行各业中,过去扎根产业,拥抱这一趋势,完成数据与技术落地闭环的企业拥有更多优势,在未来应用大爆发的过程中亦会更受到青睐。

二、加速 AI 普惠

在工业制造领域,不同「语言」之间也有着深刻隔阂。有业内人士表示,工业制造产业积累了很多数据,但制造业的工程师(比如机械工程师、材料工程师)还是很少去写程序来把这些数据利用起来,而 AI 开发者也面临理解产业问题的挑战,这在很大程度上约束了技术的落地。

思谋科技的算法工程师表示,ChatGPT 背后的技术,如 RLHF (Reinforcement Learning from Human Feedback,基于人类反馈的强化学习),让他们看到可以在现有的工作上更进一步。

RLHF 是强化学习的一个扩展,它将人类的反馈纳入训练大模型的过程,为机器提供了一种自然的、人性化的互动学习过程,就像人类从另一个专业人士身上学习专业知识的方式一样。通过在 AI 和人类之间架起一座桥梁,RLHF 让 AI 快速掌握了人类经验。

他们表示,工业 AI 未来可以孕育出一个主动学习 AIaaS(AI As a Service,人工智能即服务)平台,通过算法工程师和标注专家的配合,利用 RLHF 技术训练大模型,用人类知识让 AI 理解工业问题,并满足特定工业任务的要求,让不会编程的工业专家也能训练 AI 模型。

目前,思谋科技已经在探索 RLHF 和工业结合的应用场景。

此外,ChatGPT 这种简单的交互模式与工业制造中落地 AI 的策略亦十分相似。工业领域场景复杂,好的产品一定是简单易用的,比如通过简明的交互,一键化部署方案,减少交付过程中的培训成本与学习负担。

许多程序员表示,ChatGPT 相当于重新构建了一座宏伟的巴别塔,与计算机的交流,不再是程序员的专利,它已经可以理解部分需求,并生产简单的代码方案。但现在,我们可以预见在不久的将来,制造领域的从业者也可以在 AI 平台上实现自行编程,根据产线需求开发模型。这样也能帮助解决制造业 AI 人才短缺的问题。

「只有当计算机系统可以突破工业落地中的几大难题,实现自动算法组合和部署,人类仅需参与少量定制化算法设计时,AI 的跨领域规模产业化才具备实现的可能。」贾佳亚曾表示。

事实上,思谋科技很早开始便构想打造一个可实现技术快速迭代的开发平台,只需把图片上传,即可自动标注缺陷,一键测试得到产品级的模型或 SDK,减少项目中大量投入的算法成本。

随着项目的迭代,思谋科技逐渐把更加成熟的行业方案和实用经验整合到产品中,继而推出了完整的产品类型,让客户无需在思谋科技员工的帮助下即可自行体验与使用,从而形成了产品最早的商业化应用。

随着技术的进步,无论是面向消费者,还是面向工业制造这样的产业,我们已经看到了更普惠技术应用,正在带来巨大的机遇。

三、ChatGPT 只是一个起点

十年以来,AI 技术的商业化受到了诸多质疑。这一次,ChatGTP 背后所代表的技术突破,预示着一场革命的到来,AI 有可能真的成为普世的生产力基础设施。

「GPT (generative pre-trained transformer)也完全可以是 general - purpose technology (通用技术)的缩写」,《经济学人》的一篇文章中写到,「一种翻天覆地的创新,可以像蒸汽机、电力和计算机那样提升各行各业的生产率」[3]。

始于 20 世纪 80 年代的个人电脑革命,到 90 年代末开始真正提升生产力,因为这些机器变得更便宜、更强大,还能连接到互联网。深度学习的转折发生在 2012 年,彼时 AlexNet 神经网络在 ImageNet 比赛中获得冠军,至此大量研究开始铺开,激发人们将其应用于各个领域。十多年的时间,深度学习技术正在跨越大规模赋能产业的门槛。

回顾工业制造智能化的发展历程,技术能力和算法无法满足实际应用需求、解决方案复制性较差难以落地、新技术公司与制造业企业沟通成本高等挑战一直存在。而目前基础模型(大模型)表现出多领域多任务的通用化能力,正在打破这些行业「壁垒」,并用低成本、普惠的方式,「席卷」容错率极低、成本敏感的产业应用。

用 AI 解决产业问题蕴含着机会,ChatGPT 是一个起点,随着一些扎根产业的技术公司的持续深耕,越来越多的行业正在迎来 AI 应用的 “ChatGPT 时刻”。

本篇关于《工业AI也将迎来「ChatGPT时刻」》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于科技周边的相关知识,请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
被PyTorch打爆!谷歌抛弃TensorFlow,押宝JAX被PyTorch打爆!谷歌抛弃TensorFlow,押宝JAX
上一篇
被PyTorch打爆!谷歌抛弃TensorFlow,押宝JAX
Hinton上榜!盘点AI图像合成10年史,那些值得被记住的论文和名字
下一篇
Hinton上榜!盘点AI图像合成10年史,那些值得被记住的论文和名字
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 毕业宝AIGC检测:AI生成内容检测工具,助力学术诚信
    毕业宝AIGC检测
    毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
    7次使用
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    26次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    21次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    26次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    26次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码