第五代英特尔至强可扩展处理器以强劲性能,打造更“全能”的计算

资本角色

  随着第五代英特尔至强可扩展处理器(以下简称“第五代至强”)的问世,其也成为了多年来竞争最激烈的CPU市场的一员“大将”。

  面对不断变化的市场需求,芯片制造商凭借能够为边缘、云、AI和科学计算等应用场景打造根据工作负载优化的组件,也因此迎来了巨大的发展机遇。除了AMD、Ampere Computing和英伟达以外,主流云服务提供商对定制芯片的依赖性在增强,例如亚马逊的Graviton和微软的Cobalt等芯片。

  在接受The Register采访时,英特尔至强产品和解决方案事业部总经理Lisa Spelman不仅展示了英特尔数据中心正在以强大的执行力稳步前行,同时也分析了市场环境的变化,以及数据中心处理器产品路线图的发展变化。

  持续探索“完美”

第五代英特尔至强可扩展处理器以强劲性能,打造更“全能”的计算

  第五代至强能够实现平均20%的性能提升,这在很大程度上要归功于增大三倍的三级缓存和简化的芯粒(chiplet)架构,该架构使用两个die而不是上一代的四个。得益于上述变化,第五代至强的核心数提升至64个,这相比于主流第四代至强平台的56个核心,有了显著的改进。

  而这也源于英特尔独特的策略,长期以来英特尔始终优先考虑每个核心的性能而非核心数量,因此与AMD也有所不同。但从当下的市场变化来看,尤其是以云端使用场景为例,客户对于高核心数处理器的需求正愈发强烈。

  Spelman表示,“客户几乎不会因为只考虑核心数量而不选择英特尔的产品。但在面临科学计算等对核心数量要求较高的工作负载时,具体还是要取决于客户的实际工作负载和应用程序运行需求,并考虑处理器能否更好地融入现有系统。而且有很多至强处理器的优势是参数规格表无法直接体现的。”

  现阶段,英特尔也对多核处理器有所布局。Spelman指出,“我也正在推动至强产品路线图朝着更高核心数量的方向发展,因为我确实希望能够满足那些客户的需求。而且,如果一切进展顺利,英特尔的首款真正多核CPU(不包括至强融核处理器)将在核心数量和性能上都极具竞争力。”

  代号为Sierra Forest的至强处理器计划将在2024年上半年推出,其最多将具备288个能效核(E-core),比Ampere One的192核多50%。性能核(P-core)处理器Granite Rapids 也将紧随其后发布,尽管现阶段已知信息优先,但可以预见的是,其也将拥有更高的核心数量、改进的性能、以及在内存和IO吞吐量上的大幅提升。

  “我们正在推出性能核和能效核产品,也是源于我们对于市场发展的持续关注。”Spelman说。

  加码云计算领域

  随着越来越多的云服务提供商转向定制芯片,以及ARM推进其称为计算子系统(CSS)的shake-'n-bake CPU设计,英特尔也在持续加码云计算市场。

  作为定制芯片的代表,亚马逊云科技拥有Graviton GPU,Trainium和Inferentia AI加速器,以及Nitro SmartNICs,但他们绝非唯一构建自有芯片的公司。在业界讨论了多年之后,微软终于推出了其Cobalt 100 CPU,该CPU的部分基于ARM的CSS构建模块,并拥有128个处理器核心。

  值得关注的是微软对Arm CSS的使用,这是迄今为止Arm架构在CPU设计中最趋于完整的体现。而对于Arm来说,其目标显然是吸引更多超大规模基础设施运营商和云服务供应商以CSS作为基础,进而开发自己的定制化Arm CPU。

  亚马逊云科技和微软并不是唯一选择采用ARM核心的公司。据传谷歌正在开发自己的芯片,代号为Maple,报道称其将使用Marvell开发的设计。而甲骨文虽然并未构建自己的定制CPU,但它在Ampere Computing的ARM兼容处理器上投入了大量资金。

  Spelman表示,“尽管亚马逊云科技的Graviton芯片在ARM生态系统拥有“不俗表现”,但我们在云计算领域的前景也无需过于担忧。云服务提供商专注于以最有效的方式解决客户问题,这意味着即使他们有自己的产品,我们的芯片也有可能会被采用。”

  英特尔的前瞻规划

  尽管如期推进至强产品路线图面临挑战,但Spelman表示,一些前瞻性规划,特别是英特尔将AI加速功能适配到其CPU中的决定,已经初显成效。

  Spelman指的是去年1月随着第四代至强共同推出的高级矩阵扩展(AMX)。AMX旨在加速常见的AI和机器学习推理工作负载,并减少对独立加速器的需求。这也是英特尔最新发布的第五代至强的一大特色。第五代至强也对AMX加速引擎进行了改进,并拥有更快的内存和更大的缓存。得益于此,第五代至强现在可以以更低的延迟运行更大的模型。

  Spelman指出,“在异构计算时代,市场对于CPU、GPU、AI加速期等的需求都同时存在,因此我们也采用‘多条腿走路’的计划。”诚如此前披露的信息,第五代至强能够在可接受的延迟水平下承载参数量多达200亿的大语言模型。而对于参数量更大的模型来说,专门的AI加速器更为理想。

  回顾过往,Spelman表示对至强团队取得的进展感到满意。“从领导者的角度来看,我现在最大的目标就是保持警惕。”

文章版权声明:除非注明,否则均为杭州车汇原创文章,转载或复制请以超链接形式并注明出处。