老黄携「超级GPU」炸场!E级AI超算性能飞升,谷歌微软Meta抢先试用
科技周边小白一枚,正在不断学习积累知识,现将学习到的知识记录一下,也是将我的所得分享给大家!而今天这篇文章《老黄携「超级GPU」炸场!E级AI超算性能飞升,谷歌微软Meta抢先试用》带大家来了解一下##content_title##,希望对大家的知识积累有所帮助,从而弥补自己的不足,助力实战开发!
今日的COMPUTEX大会上,英伟达CEO黄仁勋向全世界宣布——
我们已经到达了生成式AI的引爆点。从此,全世界的每个角落,都会有计算需求。
股价刚刚暴涨2000亿美元的英伟达,为这一刻早已做好准备。
一开场,身着黑皮衣的老黄慷慨激昂地走上舞台,「大家好!We’re back!」
随后,便祭出大杀器——「超级GPU」 GH200,并宣布谷歌云、Meta和微软将率先获得GH200。
据称,有超过3500人亲临现场,体验了这个长达2个小时的激情演讲。
时隔4年,阔别已久的老黄也是狂飙中文。
「超级芯片」GH200
要说,这次演讲中,重头戏还是在GPU上。毕竟AI的iPhone已经来临。
老黄左右手分别端了一个芯片,重磅宣布,「GH200超级芯片」已经全面投产。
这一「超级GPU」使用NVLink-c2c互连技术,将基于ARM节能的GraceCPU和高性能NVIDIA H100 Tensor Core GPU结合在一起,提供了高达900GB/s的总带宽。
目前,由GH200加持的系统加入了400多种系统配置。
这些系统配置由英伟达最新的CPU、 GPU和DPU架构的不同组合提供动力。
其中包括Grace、Hopper、Ada Lovelace和BlueField,这些架构的创建是为了满足对生成式AI不断增长的需求。
此外,老黄还宣布了一个更重磅的:256个GH200组成的超算来了。
超算DGX GH200,今年上市
英伟达表示,全新DGX GH200人工智能超级计算平台,是专为大规模生成式AI的负载而设计。
这台由256块Grace Hopper超级芯片组成的超算,将拥有高达1 exaflop的超凡AI性能,以及144TB的共享内存(比上一代DGX A100多了近500倍)。
举个例子,在GPT-3训练中,它能比上一代DGX H100集群快2.2倍。
此外,这个庞然大物还包含了150英里的光纤和2,000多个风扇。
目前,英伟达已经与三大巨头进行了合作,谷歌、 Meta和微软。
由于生成式人工智能的爆炸式增长,微软、谷歌等巨头希望拥有更强大、性能更好的系统。
而DGX H200的设计目的是,通过使用英伟达定制的NVLink Switch芯片,绕开InfiniBand和以太网等标准集群连接的局限性,为最大工作负载的大规模可扩展性提供最大的吞吐量。
另外,英伟达表示正在建造自己的大型AI超级计算机NVIDIA Helios,预计在今年上线。
它将使用4个与NVIDIA Quantum-2 InfiniBand网络连接的DGX GH200系统,以提高数据吞吐量,以训练大型AI模型。
以往的数据中心都非常庞大,而且是基于CPU的,算法的迭代要花很长时间,大部分算法,也都是CPU中心的。
而现在,有了Grace Hopper,只需要几天甚至几个小时,就能完成这个过程。简直要把整个行业都革命掉了!
(等等,PaLM的参数不是540B么?)
老黄:买越多,越省钱!
作为现在的扛把子,这样一个重65磅,价值200000美元的H100计算机,是世界上第一个搭载了Transformer Engine,也是目前全世界最昂贵的计算机。
老黄表示,可以说,像这样的产品,你买得越多,就省得越多。
接下来,老黄提到1964年的IBM 360,强调了CPU的重要性。
老黄自信地重复表示,「而60年后,我们现在有数据中心。今天,数据中心就是一个计算机。」
正如老黄所说,一种新的计算模式正在被创造。
为什么使用GPU胜过使用CPU?
老黄从配置上给出了分析:花费1000万美金成本,你可以建置一个有960颗CPU的数据中心,但这个数据中心要11GWh的功率,处理1X LMM(大语言模型)的数据量。
但一样的钱,你可以建置一个配备有48个GPU的数据中心,但只要3.2GWh的功耗,而且可以处理44X LLM的数据量。
要知道,如此配置已经足够惊人。然而,这还不够。
为了获得极致性能,你可以在功耗不变的情况下,把GPU数量直接拉到172个。
此时的算力,可以高达CPU数据中心的150倍。当然,预算也提高到了3400万美元。
此外,如果你就只是单纯地想完成手头的工作(1X LLM),老黄也帮你把成本打下来了——
只需花40万美金,就能买一个搭载了2个GPU的数据中心,功耗仅0.13GWh。
台下响起一片掌声,老黄又拿出了口头禅「The more you buy,The more you save」,甚至重复了三遍。
这背后的策略,究竟是什么?老黄给了一个公式。
MGX:模块化架构
与此同时,老黄还推出了NVIDIA MGXTM,一个供系统制造商快速、低成本地构建100多个服务器变体的参考架构。
据称,这个规范可以将开发成本削减多达四分之三,并将开发时间缩短三分之二,仅需要6个月。
有了MGX,科技公司可以为他们的服务器优化加速计算的基本系统架构,然后选择自己的GPU,DPU和CPU。
MGX还可以很容易地集成到云和企业数据中心。
除了硬件之外,MGX还得到了英伟达完整软件栈的支持,这使得开发者和企业能够构建和加速 AI、 HPC 和其他应用程序。
这包括NVIDIA AI Enterprise,NVIDIA AI平台的软件层,其特点是有100多个框架、预训练的模型和开发工具,以加速人工智能和数据科学,为企业人工智能开发和部署提供充分支持。
将AI引入游戏,实时语音聊天的NPC角色来了
这次演讲的亮点,还有全新的定制AI模型代工服务 ——Avatar Cloud Engine (ACE) for Game。
现场,老黄右手手持一块RTX 4060 Ti,左手手持一台电脑,展示了运行实时光线追踪的Cyberpunk 2077。
在一个充满「赛博朋克」风格的拉面店场景中,玩家按下一个按钮,可以用自己的声音说话,然后店主Jin会进行回答。
Jin是一个NPC角色,但他的回答是由生成式AI根据玩家的语音输入实时生成的。Jin还有着逼真的面部动画和声音,与玩家的语气和背景故事相符。
这个逼真人物角色的生成,使用了一个实时人工智能模型渲染工具Nvidia Ace。
老黄表示,这个游戏中的角色并没有预先设定。他们有一个典型的任务提供者NPC类型。
但是从视频中,可以看到,虚拟角色的谈话有点生硬,但还不算太糟。
那些没有AI专业知识的人,将被抛弃
40年来,我们创造了PC、互联网、移动、云,现在是人工智能时代。
你会创造什么?不管是什么,都要像我们一样追赶它。要奔跑,不要走。要么是你为食物而奔跑,要么就是你任自己逃避,成为食物。
5月27日,黄仁勋在台湾大学发表了毕业典礼演讲。
此刻,他正为全世界所瞩目。
瞬间变身万亿掌门人,让他的话更有底气。
黄仁勋表示,每个公司和个人都应该熟悉人工智能,否则,就有失败的危险。
他强调:敏捷的公司会利用人工智能提高自己的地位,这样的公司不会倒闭。
很多人担心,AI会抢走自己的工作,但真正会抢走你饭碗的,掌握了AI技术的人。
当时,他在演讲中预言:从各方面来看,AI的兴盛是计算机产业的再生契机。在下个十年,我们的产业将使用新型的AI电脑,取代价值万亿美元的传统电脑。
而从今天的演讲中,我们仿佛已经窥见了这种未来的雏形。
以上就是《老黄携「超级GPU」炸场!E级AI超算性能飞升,谷歌微软Meta抢先试用》的详细内容,更多关于GPU,英伟达的资料请关注golang学习网公众号!

- 上一篇
- 马斯克的脑机接口获批人体实验:人造人要来了?

- 下一篇
- AI大模型加速落地数字商业 微盟寻找SaaS市场新增长
-
- 虚幻的丝袜
- 好细啊,码起来,感谢老哥的这篇博文,我会继续支持!
- 2023-05-31 07:46:53
-
- 结实的芝麻
- 赞 👍👍,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢博主分享文章内容!
- 2023-05-30 21:42:13
-
- 活泼的红酒
- 这篇文章内容真及时,好细啊,很好,已收藏,关注up主了!希望up主能多写科技周边相关的文章。
- 2023-05-30 19:27:21
-
- 科技周边 · 人工智能 | 13分钟前 | 预防措施
- 豆包AI导出失败?常见错误代码解析及解决方案
- 285浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 东风猛士M817亮相上海车展最“华”越野车
- 292浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 岚图FREE+上海车展亮相,搭载华为ADS4.0,6月预售
- 501浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 用豆包A/表情包变现攻略及方法
- 196浏览 收藏
-
- 科技周边 · 人工智能 | 7小时前 |
- LongPortMCP—长桥集团首推券商新品
- 121浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 毕业宝AIGC检测
- 毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
- 12次使用
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 26次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 23次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 26次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 27次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览