GPT-4技术细节保密惹争议,OpenAI首席科学家回应了
有志者,事竟成!如果你在学习科技周边,那么本文《GPT-4技术细节保密惹争议,OpenAI首席科学家回应了》,就很适合你!文章讲解的知识点主要包括,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~
昨天凌晨,OpenAI 出人意料地发布了 GPT-4。
这次发布令科技界颇感意外,毕竟人们普遍认为 GPT-4 会在微软周四的「The Future of Work with AI」活动上宣布。
距离 ChatGPT 首次亮相才不过四个月,它便创造了「历史上增长最快的消费者应用程序」记录。如今 GPT-4 上线,这款产品的应对能力又上了一层楼。
震撼之余,很多研究者认真阅读了 GPT-4 的技术报告,却感到了失望:怎么没有技术细节呢?
一次违背创始精神的发布
在公告中,OpenAI 分享了大量 GPT-4 基准和测试结果以及一些有趣的演示,但几乎没有提供有关用于训练系统的数据、算力成本或用于创建 GPT-4 的硬件或方法等信息。
比如,一种省流读 GPT-4 论文的结论是:「我们用的 Python。」
更有人打趣道:「我读到了 GPT-4 是基于 Transformer 架构的。」
许多 AI 领域的成员批评了这一决定,指出它破坏了 OpenAI 作为研究型组织的创始精神,并使其他人更难复现其工作。
对 GPT-4 封闭模型的大多数初始反应都是负面的,但似乎愤怒已经不能改变其「闭源」的决定:
其实对于 OpenAI 不开源的批判已持续了一段时间。连 OpenAI 的创始团队成员马斯克都公开质疑过其「背离初心」:
就这件事,让马斯克至今仍感到困惑:「我不懂,当初投了近 1 亿美元的非营利机构怎么就变成了市值 300 亿的商业公司呢?」
Nomic AI 信息设计副总裁 Ben Schmidt 说道:「我认为可以停止称其『Open』了 —— 介绍 GPT-4 的 98 页论文自豪地宣称他们没有披露关于训练集内容的任何信息。」
还有一些人认为, OpenAI 隐藏 GPT-4 细节的另一个原因是法律责任。AI 语言模型是在巨大的文本数据集上训练的,许多模型(包括早期的 GPT 系统)都会从网络上抓取信息,其中一个来源可能包括受版权保护的素材。目前已有几家公司正被独立艺术家和图片网站 Getty Images 起诉。
一些人表示,更重要的是,这会使针对 GPT-4 构成的威胁制定保障措施变得更困难。Ben Schmidt 也认为,由于无法看到 GPT-4 训练的数据,很难知道该系统可以在哪里安全使用并提出修复方案。
「众所周知,像 GPT-4 这样的神经网络是黑盒子。事实上,它们的操作是不可预测和难以理解的,这是关于是否应该使用它们、在何处使用它们的最重要问题之一。现在 OpenAI 正逐步制定一个标准,进一步扩展了这个谜团。」Ben Schmidt 表示。
OpenAI 首席科学家:开源 GPT-4 是不明智的
OpenAI 的首席科学家兼联合创始人 Ilya Sutskever 对上述争议进行了回应,表示 OpenAI 不分享更多 GPT-4 细节信息的原因是「害怕竞争和担心安全」:
「从竞争格局上看,外界的竞争很激烈。GPT-4 的开发并不容易,几乎集聚了所有的 OpenAI 力量,经过很长时间的努力才产出了这个东西,而且有很多公司都想做同样的事情。」
「安全方面的原因不像竞争方面那样突出,但它也会发生变化。这些模型是非常高效的,而且它们变得越来越高效。某些时候,如果有人愿意,用这些模型造成巨大的伤害将会相当容易。随着这些能力越来越高,不公开它们是有道理的。」
当被问及「为什么 OpenAI 改变了分享研究成果的方式」,Sutskever 回答说:「坦率地说,我们错了。如果你像我们一样相信,在某个时候,AI 或 AGI 将变得极其强大、令人难以置信,那么开源就没有意义。这是一个坏主意,我完全相信在几年内,每个人都会清楚地认识到开源 AI 是不明智的。」
Lightning AI 首席执行官、开源工具 PyTorch Lightning 的创建者 William Falcon 对 VentureBeat 表示,自己能从商业角度理解这个决定:「作为一家公司,你完全有权这样做。」
但他也表示,OpenAI 此举为更广泛的社区树立了一个「坏的模板」,可能会产生有害影响。
关于 OpenAI 不共享其训练数据的原因,Sutskever 的解释是:「我对此的看法是,训练数据是技术。我们不公开训练数据的原因与我们不公开参数数量的原因几乎相同。」当被问及 OpenAI 是否可以明确声明其训练数据不包含仿版材料时,Sutskever 没有回答。
Sutskever 同意 OpenAI 批评者的观点,即开源模型有助于保障措施的开发。「如果有更多人研究这些模型,我们就会了解更多,那就更好了,」他说。出于这些原因,OpenAI 向某些学术和研究机构提供了访问其系统的权限。
接下来,我们期待什么?
由 GPT-4 引发的热议预计还会持续一阵,以至于人们可能会忽略一些其他动态。
比如,在昨日铺天盖地的讨论中,谷歌的发布就显得静悄悄。目前,Google Workspace 中已经全面集成了生成式 AI,更新了生成图片、演示文稿、电子邮件、文档等功能。可以想象的是,这将是一次生产力的大提升。
接下来,人们可以期待的还有很多:不久之后,微软 CEO 萨蒂亚・纳德拉将亲自登台演讲,介绍微软和 OpenAI 的更多合作,比如基于 GPT-4 的 Office 套件。
消息来源:https://www.theinformation.com/articles/microsoft-rations-access-to-ai-hardware-for-internal-teams
让我们拭目以待。
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

- 上一篇
- 如何修复Windows PC上的大写锁定反向问题

- 下一篇
- 人脑90%都是自监督学习,AI大模型离模拟大脑还有多远?
-
- 感动的小懒猪
- 太给力了,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢大佬分享技术贴!
- 2023-05-15 09:04:30
-
- 无限的小鸭子
- 这篇文章真是及时雨啊,太细致了,太给力了,码住,关注老哥了!希望老哥能多写科技周边相关的文章。
- 2023-04-30 22:28:02
-
- 科技周边 · 人工智能 | 16分钟前 |
- Excel+Python预测分析教程详解
- 118浏览 收藏
-
- 科技周边 · 人工智能 | 20分钟前 |
- 6月二手车交易量165.75万台,环比增长3%
- 179浏览 收藏
-
- 科技周边 · 人工智能 | 23分钟前 |
- 理想高管力赞ModelY续航,值得借鉴
- 120浏览 收藏
-
- 科技周边 · 人工智能 | 44分钟前 |
- Deepseek满血版+GeniusScan,文档处理攻略
- 110浏览 收藏
-
- 科技周边 · 人工智能 | 47分钟前 |
- PerplexityAI如何解析代码与语法
- 106浏览 收藏
-
- 科技周边 · 人工智能 | 54分钟前 |
- Deepseek+Grammarly,高效沟通新组合
- 208浏览 收藏
-
- 科技周边 · 人工智能 | 57分钟前 |
- DeepSeek数据预测功能详解
- 398浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 新手必学通灵义码技巧提升操作
- 146浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 通灵义码5个实用技巧分享
- 113浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 498次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 千音漫语
- 千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
- 169次使用
-
- MiniWork
- MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
- 169次使用
-
- NoCode
- NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
- 172次使用
-
- 达医智影
- 达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
- 176次使用
-
- 智慧芽Eureka
- 智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
- 189次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览