当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 再一次改变“AI”世界 GPT-4千呼万唤始出来

再一次改变“AI”世界 GPT-4千呼万唤始出来

来源:51CTO.COM 2023-04-10 15:06:50 0浏览 收藏

知识点掌握了,还需要不断练习才能熟练运用。下面golang学习网给大家带来一个科技周边开发实战,手把手教大家学习《再一次改变“AI”世界 GPT-4千呼万唤始出来》,在实现功能的过程中也带大家重新温习相关知识点,温故而知新,回头看看说不定又有不一样的感悟!

再一次改变“AI”世界 GPT-4千呼万唤始出来

近段时间,人工智能聊天机器人ChatGPT刷爆网络,网友们争先恐后去领略它的超高情商和巨大威力。参加高考、修改代码、构思小说……它在广大网友的“鞭策”下不断突破自我,甚至可以用一整段程序,为你拼接出一只小狗。而这些技能只是基于GPT-3.5开发而来,在3月15日,AI世界再次更新,最新版本的GPT-4也被OpenAI发布了出来。

与之前相比,GPT-4不仅展现了更加强大的语言理解能力,还能够处理图像内容,在考试中的得分甚至能超越90%的人类。那么,如此“逆天”的GPT-4还具有哪些能力?它又是如何炼成的呢?

“逆天”的GPT-4

在发布了GPT-4后,OpenAI官网一度发生拥堵,很多用户在社交媒体里面表示他们立刻订阅了Plus服务。GPT-4在发布后,“GPT-4”这一词条迅速登上美国、日本等地区热榜,也登上了国内的微博热搜榜、抖音热榜社会榜等。

据OpenAI官方介绍,GPT-4是一个大型的多模式模型,可以接收图像和文本输入,输出文本。虽然它在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的性能。比如GPT-4可以通过模拟SAT(美国学术能力评估测验),并取得前10%的成绩,而GPT-3.5的成绩则在最后10%之列。

再一次改变“AI”世界 GPT-4千呼万唤始出来

我们看到,在官方演示视频中,Open AI总裁兼联合创始人Greg Brockman还让用户先睹为快,了解最新版系统的图像识别功能,该系统尚未公开,仅由一家名为Be My Eyes的公司测试。该功能将允许 GPT-4 分析和响应与提示一起提交的图像,并根据这些图像回答问题或执行任务。“GPT-4 不仅仅是一种语言模型,它还是一种视觉模型,”Brockman表示,“它可以灵活地接受任意穿插图像和文本的输入,有点像文档。”

在演示的另一个时刻,Greg Brockman向GPT-4提交了一张手绘和初步网站草图的照片,系统创建了一个工作基于绘图的网站。

再一次改变“AI”世界 GPT-4千呼万唤始出来

再一次改变“AI”世界 GPT-4千呼万唤始出来

  业界认为,ChatGPT-4比GPT-3强大571倍,最受益于这一最新成果的三大职业就是作家、市场营销人员和创业者。根据对两者比较,业界人士还指出GPT-4的其他优势,如训练数据更多、答复更加多样性和有创意性以及反应所需时长更短,一秒即可。

再一次改变“AI”世界 GPT-4千呼万唤始出来

我们认为,这种升级体现的一个主要趋势就是多模态,模型变得更加复杂庞大,可以将不同类型的数据放入同一模型,对我们周边的环境和真实世界做出更好的理解。

此外,在多语种方面,GPT-4也体现出优越性。在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能,其中包括部分低资源语言如拉脱维亚语、威尔士语等。在中文语境中,GPT-4能够达到80.1%的准确性。

不过,OpenAI也在官方网站上给出了GPT-4存在的不足,其仍然存在包括社会偏见、捏造事实、对抗生成等已知限制。OpenAI对此表示,随着社会对AI模型的接受,将增加透明度,鼓励并促进用户教育和更广泛的人工智能素养,并致力于扩大人们在培养AI模型方面的输入途径。

GPT-4可以商业化了

随着GPT-4的发展,我们发现它的能力虽然在很多现实场景中不如人类,但在各种专业和学术基准测试中表现出了与人类相当的水平,这也意味着,GPT-4确实在商业化上更进一步了。

此前,GPT-3在专业领域的表现一直被人们认为差强人意,在美国的律师资格考试Uniform Bar Exam (MBE+MEE+MPT)中,GPT-3.5只能排在倒数10%,而GPT-4的成绩则已经可以排到前10%。GPT-4在专业领域的能力实现了巨大提升,在一些专业领域已经开始逐渐接近甚至超过人类,这给GPT-4在很多ToB商业领域提供了更多可能性。

比如专业技能辅助工具,知识检索类的应用,职业教培辅导等领域,GPT-4带来的能力可能将会是革命性的。

GPT-4发布之后,微软在第一时间表示:“如果你在过去五周内的任何时候使用过新的Bing预览版,你就已经提前了解了OpenAI最新模型的强大功能”。这表示New Bing早已经用上了GPT-4,在过去几周,很多人体验的必应就是GPT-4加强过的,仅仅开放使用了文字能力而已。虽然微软没有用全球首发的字眼来描述,毕竟微软在OpenAPI上已经投入了130亿美元(约合人民币900亿元),换来的这样的待遇也是情理之中。

除了微软的New Bing外,目前还有多家公司将GPT-4搭载到他们的产品中,包括语言学习工具软件多邻国(Duolingo)、帮助视障用户的软件BeMyEyes、移动支付公司Stripe、国际性金融服务公司摩根士丹利等。

但不得不承认的是,虽然GPT-4大幅拓宽了大模型可能落地的商业化场景,但算力、研发成本,仍被很多人认为是大模型落地过程中很难跨过的障碍。毕竟大模型的研发、算力支出在目前看来高得吓人,此前ChatGPT公开的单次训练、日常运营开支都是以百万美元为单位的,短期内想要商用可能很难控制成本。

GPT发展史

众所周知,ChatGPT是OpenAI公司研发的一个大型自然语言处理模型,但很多人不知道,它的发展历程可以追溯到2015年。2015年,OpenAI由特斯拉的马斯克、Sam Altman及其他投资者共同创立,旨在通过先进的人工智能技术推动人工智能领域的发展。而马斯克则在2018年时因公司发展方向分歧而离开。

此前,OpenAI因推出 GPT系列自然语言处理模型而闻名。从2018年起,OpenAI就开始发布生成式预训练语言模型GPT(Generative Pre-trained Transformer),可用于生成文章、代码、机器翻译、问答等各类内容。

每一代GPT模型的参数量都爆炸式增长,2019年2月发布的GPT-2参数量为15亿,在2020年5月,当OpenAI发布了GPT-3,它已经是世界上最先进的自然语言生成模型。GPT-3具有1750亿个参数。

GPT-3出现时,作为一个无监督模型(现在经常被称为自监督模型),几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。

而且,该模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器,更令人惊讶的是在两位数的加减运算任务上达到几乎100%的正确率,甚至还可以依据任务描述自动生成代码。一个无监督模型功能多效果好,似乎让人们看到了通用人工智能的希望,可能这就是GPT-3影响如此之大的主要原因。

2021年,OpenAI宣布将推出一个新的名称,名为“DALL-E",这是一种能够生成图像的人工智能技术。同时,OpenAI也在研发更加先进的自然语言处理技术。

此后的故事相信大家都很清楚了,2022年底基于GPT-3.5的ChatGPT以光速席卷全球,成为全球最大的“科技明细”,直到现在GPT-4的发布更是登上多国热搜。

再一次改变“AI”世界 GPT-4千呼万唤始出来

写在最后

GPT的未来怎么样?可以预见的是,随着算法技术和算力技术的不断进步,ChatGPT也将会进一步走向更先进功能更强的版本,在越来越多的领域进行应用,为人类生成更多更美好的对话和内容。

也许GPT距离正在的“AI”还有距离,但我们不妨把它当做一个起点,一个全新“AI”时代的起点。

以上就是《再一次改变“AI”世界 GPT-4千呼万唤始出来》的详细内容,更多关于GPT-4,ChatGPT的资料请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
360浏览器下载文件失败出现乱码怎么办?360浏览器下载文件出现乱码解决方法360浏览器下载文件失败出现乱码怎么办?360浏览器下载文件出现乱码解决方法
上一篇
360浏览器下载文件失败出现乱码怎么办?360浏览器下载文件出现乱码解决方法
你能相信吗?一半人工智能模型从未投入生产
下一篇
你能相信吗?一半人工智能模型从未投入生产
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 互联网信息服务算法备案系统:如何完成算法备案流程
    互联网信息服务算法备案系统
    了解互联网信息服务算法备案系统,掌握如何进行算法备案的详细步骤和要求,确保您的互联网服务合规运营。
    59次使用
  • SEO标题魔匠AI:高质量学术写作平台,毕业论文生成与优化专家
    魔匠AI
    SEO摘要魔匠AI专注于高质量AI学术写作,已稳定运行6年。提供无限改稿、选题优化、大纲生成、多语言支持、真实参考文献、数据图表生成、查重降重等全流程服务,确保论文质量与隐私安全。适用于专科、本科、硕士学生及研究者,满足多语言学术需求。
    105次使用
  • PPTFake答辩PPT生成器:一键生成高效专业的答辩PPT
    PPTFake答辩PPT生成器
    PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
    138次使用
  • SEO标题Lovart AI:全球首个设计领域AI智能体,实现全链路设计自动化
    Lovart
    SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
    267次使用
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    126次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码