18个月,OpenAI这支团队搞出了GPT-4o
大家好,今天本人给大家带来文章《18个月,OpenAI这支团队搞出了GPT-4o》,文中内容主要涉及到,如果你对科技周边方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!
奥特曼:如果没有他(Prafulla Dhariwal)的远见、才华、信念和决心,就不会有 GPT-4o。
“GPT-4o的诞生离不开@prafdhar的远见、才华、信念和长期以来的坚定决心。正是这些努力(以及许多其他人的工作)促成了我希望会成为计算机使用方式革命的成果。”
在 OpenAI 发布新一代旗舰生成模型 GPT-4o 后的两天,OpenAI CEO 奥特曼对参与该项目的其中一位负责人评价道。
在经过与OpenAI的多个团队合作的18个月里,联合创始人Greg Brockman表示:“GPT-4o是整个团队努力的结果。特别要感谢@prafdhar,他坚信能够够构建一个全能模型,并在过去的18个月里与OpenAI的多个团队展开合作,从而实现了这一目标。”
看到这,估计大家都很好奇,prafdhar 到底是谁,他就是 Omni 团队负责人 Prafulla Dhariwal,也是 GPT-3、DALL-E 2 共同创造者。Dhariwal 表示,“GPT-4o(o代表 omni)是 Omni 团队推出的首个模型,也是 OpenAI 首个原生的全多模态模型。这次发布是整个组织共同努力的结果”。同时,Dhariwal 提到他想特别感谢团队中一些出色的成员,正是他们让这个神奇的模型成为可能!
Dhariwal 口中出色的团队成员到底有谁,整个团队贡献者都有哪些,接下来我们将为大家一一揭晓。
Prafulla Dhariwal
Prafulla Dhariwal 是 OpenAI 的一名研究科学家(也是前文奥特曼特别感谢的人),研究方向主要是生成式模型和无监督学习。他在 2017 年加入 OpenAI,至今已有 7 年多的时间。
Prafulla Dhariwal 本科毕业于麻省理工学院。在 MIT,Prafulla Dhariwal 主要学习计算机科学、数学、物理学,并在 MIT 大脑、思维和机器中心担任本科生研究员。
根据 Google Scholar 显示,Dhariwal 论文引用次数达到 72200 多次,参与的研究包括 DALL-E 2、DALL-E 3、Glow、Consistency Models 等,都是大家比较熟悉的。
James Betker
James Betker 是 OpenAI 的研究工程师,主要研究图像和音频的生成式建模。
在加入 OpenAI 之前,James Betker 在 GARMIN 国际航电瑞士有限公司担任了 12 年的软件工程师,并曾在谷歌担任软件工程师。
Rowan Zellers
Rowan Zellers 是 OpenAI 的研究员,致力于构建通过语言、视觉和声音理解人类和世界的机器。
Prafulla Dhariwal 表示:「Rowan Zellers 的研究工作让 GPT-4o 能够像人类一样自然地观看视频。」Rowan Zellers 也是 GPT-4 研究团队成员之一。
Alexis Conneau
Alexis Conneau 现在为 OpenAI 音频 AGI 研究负责人。Dhariwal 表示 Conneau 比 OpenAI 的任何人都更早地提出了 HER 的愿景,并坚持不懈地执行!
Gabriel Goh
Gabriel Goh 为 OpenAI 机器学习研究员,他对可解释性、机器学习、数据可视化和凸优化感兴趣。曾经参与了 DALL・E 1、DALL・E 3、GPT-4 等的研究。
Ishaan Gulrajani
Ishaan Gulrajani 现在为 OpenAI 机器学习研究者,此前他博士毕业于斯坦福大学,曾经参与过 Alpaca、Stanford alpaca 等的研究。
Alex Nichol
Alex Nichol 在 OpenAI 从事深度学习研究,DALL-E 2 共同创造者,擅长代码、人工智能和 3D 打印。
Li JING
Li JING 是 OpenAI 的研究员,在 GPT-4o 工作中主要进行图像 / 3D 生成方面的研究。
Li JING 也是 DALL・E 3 和 Sora 的研究团队成员。Li JING 的研究工作致力于帮助人工智能理解现实世界并创造新的智能。
Casey Chu
Casey Chu 是 OpenAI 的一名研究员,研究多模态人工智能系统,参与过 GPT-4、DALL・E 2 的研究。此前,他博士毕业于斯坦福大学。
Mark Chen
中间一位是 Mark Chen
Mark Chen 为 OpenAI 前沿研究主管,5 月 14 日凌晨发布会现场就有他的身影,Mark Chen 曾参与过 DALL・E、GPT-4 等的研究。
Jiahui Yu
Jiahui Yu 在 OpenAI 领导感知团队,此前,他在伊利诺伊大学厄巴纳 - 香槟分校获得博士学位。在加入 OpenAI 之前,Jiahui Yu 在谷歌参与的研究包括 Gemini、PaLM 2 等。
Huiwen Chang
Huiwen Chang 于 2023 年加入 OpenAI,此前她在谷歌担任高级研究科学家,本科毕业于清华大学。
A. Jabri
A. Jabri 为 OpenAI 的技术人员,主要研究领域是用于自监督和无监督学习的可扩展目标和架构。此前曾在谷歌 DeepMind 实习。
Christine McLeavey
Christine McLeavey 是 OpenAI 的技术团队成员,主要进行多模态研究工作。她的研究兴趣主要在于音乐生成,她也是 OpenAI 音乐模型 MuseNet 研究团队成员。
Yu Zhang
Yu Zhang 是 OpenAI 技术团队成员,曾在 Google DeepMind 担任了 6 年的研究科学家。
Yu Zhang 本科毕业于上海交通大学计算机科学系,博士毕业于 MIT 计算机科学系。
除了上面提到的这些研究者,OpenAI 官方也放出了完整名单:
完整名单地址:https://openai.com/gpt-4o-contributions/
其中,语言方面的核心贡献者包括:
多模态核心贡献者包括:
感兴趣的读者,可以查看完整名单了解更多信息。
今天关于《18个月,OpenAI这支团队搞出了GPT-4o》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

- 上一篇
- 如何加速 Golang 单元测试的执行速度?

- 下一篇
- 如何在 Golang 单元测试中使用 gomega 进行断言?
-
- 科技周边 · 人工智能 | 3分钟前 |
- 小米补偿SU7Ultra车主:赠送洗车机及5000积分
- 386浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 理想MEGA、L9、L7获评客户满意度优秀
- 310浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- VoiceCanvas开源AI语音合成,多语言多音色克隆
- 498浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 | 即梦AI高级功能 会员权限开通
- 即梦AI高级功能解锁攻略会员权限快速开通
- 411浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 13次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 14次使用
-
- 可图AI图片生成
- 探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
- 42次使用
-
- MeowTalk喵说
- MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
- 39次使用
-
- Traini
- SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
- 36次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览