当前位置:首页 > 文章列表 > 科技周边 > 业界新闻 > 最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

来源:IT之家 2024-06-06 20:54:44 0浏览 收藏

最近发现不少小伙伴都对科技周边很感兴趣,所以今天继续给大家介绍科技周边相关的知识,本文《最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增》主要内容涉及到等等知识点,希望能帮到你!当然如果阅读本文时存在不同想法,可以在评论中表达,但是请勿使用过激的措辞~

英特尔于2024年的创新高峰大会上,正式推出了全新的至强6处理器系列,这一系列处理器分为能效核(代号Sierra Forest)和性能核(代号Granite Rapids)两种版本。

基于英特尔至强 6 的产品路线图,从本月到2025年第1季度,将有2个系列至强 6 能效核处理器和5个系列至强 6 性能核处理器陆续上市。其中 Xeon 6700E 系列将于6月6日,正式在中国大陆上市。

具体 SKU 系列如下:

  • 至强 6 能效核:Xeon 6700E / 6900E

  • 至强 6 性能核:Xeon 6900P / 6700P / 6500P / 6300P / 6 SoC

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

当前企业用户对人工智能的关注度空前绝后,背后有着巨大的市场等待开发,想要更好的推进 AI 应用,很大程度上也是需要服务器算力支持,服务器性能是一方面,另一方面则是容耐,容耐是数据中心的主要支出来源,更高性能和更低功耗这是许多企业所追求的。另外,软件通用性、可靠性、速度和延迟这些都影响到服务的稳定和效率。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

英特尔针对上述数据中心市场的需求变化正式发布了至强 6 处理器。这一系列处理器包含能效核心和性能核心两个版本。这也是英特尔第一次将至强产品分拆为两个系列。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

其中能效核有着更好的能效表现,优势在微服务、云原生、简单的数据库或是网络应用等,这些服务需求对服务器单核并没有很高的算力密度要求;性能核则专注设计、大数据、AI 推理、游戏等高负载,对单核性能要求较高的应用场景。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

从五年一个周期来看,至强 6 能效核在其擅长领域上有 2 倍到 3 倍的性能提升。性能核与上一代相比则有 2 倍以上的性能提升,其中性能和擅长领域则是人工智能、高性能计算、通用计算等场景。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

具体来看至强 6 能效核,其能效比相比于第二代至强有着大幅的提升,在转码表现上,其最高性能每瓦有 2.6 倍的提升,最高性能则有 4.2 倍提升,算力提升的同时,功耗也有很好的下降。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

相比传统的 200 个机柜的数据中心,使用至强 6700E 系列则可以大幅减少机柜数量,只需原先 1/3 的机柜量就能达成之前同等算力。在与英特尔的前期测试中,ebay 相比于竞品有 25% 的性能功耗比优势,相比于现在第三代至强则有着 90% 的性能功耗比优势。SAP 则通过至强 6 能效核做到了大幅的能源节约,通过至强 6 能效核跑之前相同的负载节省 60% 的电能。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

根据目前英特尔的节奏,至强 6 能效核将在本月率先上市并推出第一款产品 6700E,近年三季度将会推出 6900P,明年也会陆续推出更多型号。至强 6 能效核为什么能带来这么多的能效提升,这很大一部分原因是英特尔对至强 6 进行全新的设计,并以此达成这些能效目标。

英特尔至强 6 的能效核与性能核在架构设计都采用了相同的底层技术和硬件模块,其中能效核的 6700 系列平台是传统至强平台的延续,支持 1/2/4/8 路可扩展性。核心上来看,相比于第五代的 64 个性能核增加到 86 个,能效核最高达到 144 个,有着 30% 以上的核心数提升。内存速度也从之前的 5600MT/s提升到 6400MT/s,对于一些对内存带宽要求更多的应用,英特尔在至强 6 平台上,提供了 MCR 技术,它可以进一步把内存速度从 6700 提升到 8000MT/s,当应用到一些高带宽需求的业务时能够有非常好的表现。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

基于性能核的 6900 系列则最高配备 128 核心性能核,288 个核心能效核内存带宽可以通过 MCR 技术提升至 8800MT/s,其内存总体带宽达到上一代的 2.36 倍,而且在增加内存核心数量的同时,它的内存带宽也有着更大幅度的增加。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

分别代表着能效核与性能核的 6700 系列和 6900 系列都配备了更多的 PCIe 通道和 CXL 接口以及两个 CPU 互联的 UPI 带宽。性能核包含了如 AVX-512、AMX 这样的向量、矩阵运算单元,为高并发,特别是像 AI、科学计算类的业务提供了非常好的性能。同时随着 MCR 内存技术的加持,也可以为高性能计算核心提供很高的带宽支持。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

在乱序的执行单元方面,性能核提供了 512 长度的乱序执行引擎,能够更好的优化编程中的软件指令,可以更大程度使用整个后面的执行引擎。

能效核在服务器端新引入的一个产品版本。它的特点是针对一些功能进行了简化,比如它并不具备 AVX-512 和 AMX 的功能,针对 L2 Cache 也有所调整。性能核每个核是 2M,而能效核平均每个核是 1M,L3 的容量也不一样。通过这些调整,让每个能效核所占的硅片面积大幅度降低,功耗所有减少。所以在同平台、同面积、同功耗下,至强 6 可以提供更多的核心数量、更大吞吐量和更低的能耗。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

从封装构造上来看,我们注意到第五代至强与至强 6 在设计理念上有很大的变化。第五代至强采用了 EMIB 技术将两个模块结合起来,这种设计巧妙地突破了传统研磨尺寸对模块尺寸的限制,使得单个处理器得以集成更多复杂的逻辑功能,从而大幅提升了性能和功能性。

而至强 6 的设计理念有了变化,并不是简单的把模块的大小一分为二,而是按照功能块进行划分。可以看到,右侧图的中间是计算模块,上下两部分是 I / O 模块,I / O 模块更多是和高速 I / O 相关,而且对密度要求并不高,所以使用 Intel 7 这样相对比较成熟的工艺来做 I / O 模块,而计算模块对计算密度及核心逻辑密度要求比较高,因此则采用最新的 Intel 3 制程工艺。从模块封装和 SoC 的构造来看,第五代至强到至强 6 其实是有比较大的改变的。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

具体来看,至强 6 个产品构成,基于其中 6700 系列的有基于能效核的计算模块和 2 个 IO 模块;还有基于性能核的三款 SKU,XCC、HCC 与 LCC 分别代表高中低档不同核心数版本的模块。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

另外两款基于 6900 系列的产品,IO 模块的形状和数量和尺寸和 6700 系列上的是一样的,只是计算核心数量不同,6900 系列性能核版本采用了 3 篇 XCC 计算模块,从计算核心数量来说,配备性能核的 6900 的核心数量大约增加了 50%。而能效核是采用了和配备能效核的 6700 同样的计算单元,只是数量上从 1 片增加到 2 片,核心数量从 144 个增加到了 288 个。

实现这样一个模块化设计有几个关键要素,首先是要有 Fabric 技术,能够把计算模块和 I / O 模块有机结合起来。二是集成多个模块的系统架构,即面对多个模块时,也能通过 Fabric 技术无缝地将它们连接成一个整体。想象一下,每个模块内部都拥有纵横交错的通路网络,而当这些模块通过集成多个模块架构相互连接时,它们的通路不仅得以延续,还能相互融合,共同构建起一个规模更大、更为强大的通路系统。

这种设计不仅优化了数据传输效率,还极大地扩展了处理器的功能和性能。而这些通路的结合,就是通过 EMIB 来相互连接,EMIB 技术可以实现非常高密度的模块之间的桥接,能够让模块和模块之间达到 1TB / s 的速度,这样可以使跨模块连接做到带宽无损通信。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

接下来,具体来看计算模块的内部结构,这里包含了中间的核心部分(包括 L1 / L2 缓存)、缓存及内存访问相关的控制器、L3 缓存以及横向和纵向的 Mesh Fabric,在核心两侧是 2 个 DDR5 或 MCR 内存控制器。这样的好处是每个模块内部的核心缓存以及内存访问都是在比较小的范围内,因此它的访问延迟比较低。6900 或是 6700 的 XCC 版本多个模块之前又形成了无缝连接,用很小的延迟,实现了很好的性能扩展。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

接下来是 IO 模块部分,IO 模块与计算模块也是通过 Fabric 以及 EMIB 相连,这里继承了很多 IO 接口,比如 PCIe、CXL、UPI,QAT、DSA 等加速单元,以及 RDT 资源调度等功能。

这里特别说明一点,CXL 是英特尔推出的技术,在此前的第四代、第五代至强产品上都有相关功能,这次升级的 CXL 2.0 首次应用在至强 6 中。CXL 2.0 为 Type 3 设备引入了增强功能,包括链路细分、QoS 控制等,从而为 Type 3 设备客户特别关注的使用场景,提供了更全面的功能特性。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

Type 3 设备用户可以使用的不同的模式实现内存扩展。内存扩展的第一种模式是 CXL Numa node,它允许将系统的标准 DRAM 内存和通过 CXL 技术扩展的内存作为两个独立的 Numa 节点,并且可以在软件层面进行控制。通过在系统软件或应用层进行内存内容的分层管理,可以优化配置并屏蔽上层业务,这也是 CXL 一直采用的管理模式之一。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

但是对于某些 ISV 或是无法对自身软件进行修改优化的企业来说,他们依然希望能够用一个对软件透明,并从硬件层面上提供的一个整体 CXL 以及和系统原生 DRAM 内存的解决方案。针对这样的硬件管理方案,英特尔提供了两种模式。一种叫异构交织(Hetero Interleaved)模式,它是把系统原生的 DRAM 内存和 CXL 内存,从地址上进行混合。从带宽上来看,每个 CXL 内存交织的通路和 DRAM 交织的通路是平衡的,因此 CXL 延迟略有区别,但整体对系统的吞吐影响并不大。通过这样一个异构交织功能,可以给系统平台提供更大的内存带宽,而且应用程序并不会直接感知或是直接管理到这个 CXL 内存。这是在至强这个平台提供第一种关于硬件的 CXL 管理方式。

第二种方式是通过平面存储器模式,这种模式是让 CXL 和原生 DRAM 做一个硬件辅助的分层,在 1:1 的情况下,会尽量把 CXL 常用的数据放在 DRAM 中,虽然一部分数据放在 CXL 当中,但是随着这样的一个硬件分层管理,就可以非常接近于完全 DRAM 的性能表现。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

我们看到,MongoDB 数据库表现在不同模式之间性能还是有所差距的。左边是评估场景,一种情况是在系统中设置了 512G 的 DDR5 内存,另一种是通过平面存储器模式,其中 256G 是 DRAM,另外 256G 是 CXL 内存。当数据容量为 125G 的时候,这两者之间只有 1% 的性能差距,而当数据容量为 256G,即与总容量几乎一样时,采用硬件分层的引擎只有 2% 的性能差距,若是数据量进一步增加,也只有 5% 的性能差距。

由此可见,采用平面存储器模式可以让用户使用譬如 DDR4 这样低成本的 CXL 扩展方式,在扩展系统内存容量的同时,将对其业务性能的影响降到最小。

接下来,再来看下至强 6 的性能亮点。至强 6700 系列产品采用能效核以实现更高的密度和并发度,且拥有优秀的能效比。与第五代至强处理器相比,至强 6 能效核整数吞吐性能提升了 25%,另外在媒体编解码、网络防火墙等业务上均有 20%、30% 甚至高达 40% 的提升。

而相较于性能方面的提升,其能效提升更加显著,可以看到绝大多数业务均有 30%、40% 甚至更高的能效提升,这便是采用能效核处理器为整个平台带来的收益。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

对于数据中心客户而而言,配备英特尔至强 6 能效核产品后,算力的提升能替换更多过时算力,以此腾出更多的空间部署更多算力,进一步帮助数据中心客户做到了很好的成本控制。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

从五年产品更新的角度来看,至强 6 能效核与第二代至强处理器相比有 3 倍以上的性能提升,同时其能效方面也有超 2 倍的提升,且每个处理器的热设计功耗也均在上升。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

至强 6 处理器可实现与第二代至强 3:1 的替换比,即原来需要三个机架才能完成的任务,现在仅需要一个至强 6 机架即可完成。以整数吞吐和媒体解码为例,可以看到整体机架级别的性能提升了 2.7-3.2 倍,每瓦性能提升 2.6-2.7 倍,这带来的计算集群功耗节省以及碳排放节约是非常显著的。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

作为首批上市的至强 6 产品,至强 6 能效核首批 SKU 共 7 款,覆盖 64-144 核,其他能效核与性能核版本,也将会在今年 3 季度和 2025 年 1 季度陆续推出。

最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增

总体来看,这次至强 6 的进化无疑是巨大的,性能大幅提升,能耗也得到了很好的控制,模块化的设计也具有出色的扩展性。

理论要掌握,实操不能落!以上关于《最高 288 核!英特尔至强 6 处理器详解:新老型号性能 1 换 3,能效比大增》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

版本声明
本文转载于:IT之家 如有侵犯,请联系study_golang@163.com删除
美团 2024 年第一季度营收 732.8 亿元同比增长 25%,经调净利润同比增长 36.4%美团 2024 年第一季度营收 732.8 亿元同比增长 25%,经调净利润同比增长 36.4%
上一篇
美团 2024 年第一季度营收 732.8 亿元同比增长 25%,经调净利润同比增长 36.4%
golang框架开发实战:疑难问题自查手册
下一篇
golang框架开发实战:疑难问题自查手册
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    14次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    12次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    11次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    16次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    17次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码