目前中国芯片技术如何让不拼核数至强CPU稳住数据中心王座

在指令集架构的竞争激烈领域,X86、Arm和RISC-V各自展现出独特的优势,但近年来数据中心市场的竞争愈发白热化。Arm阵营正在向服务器市场进军,企图与x86和RISC-V正面对抗,而2022年底亮相的服务器级别RISC-V CPU预计将在2023年中投产。

内部竞争加剧外部局势动荡,一年内英特尔数据中心业务频频下滑,其市场表现未能达到预期,因此急需更具竞争力的产品来挽回损失。1月11日,英特尔正式发布了至强可拓展处理器(代号“Sapphire Rapids”),并推出了英特尔至强CPU Max系列(代号“Sapphire Rapids HBM”)以及英特尔数据中心GPU Max系列(代号“Ponte Vecchio”)。这些新产品家族带来了哪些性能优势?它们是否能够助力英特尔夺回数据中心处理器第一的地位?

新添七大算力神器,不仅核心数量重要

自2017年以来,英特尔已经向全球客户交付超过8500万颗至强可扩展处理器,这些处理器支持着全世界的数据中心。在过去两年的时间里,即第三代英特尔至强可扩展处理器已全球累计出货1500万颗。这一切都是基于Intel 7制程工艺制造,并且采用全新的芯片架构,其支持每个插槽最多60个内核,以及每个系统1、2、4或8个插槽,每个插槽有80个PCIe Gen5通道,搭配DDR5内存和CXL 1.1等新技术,以支持高带宽和附加加速器效率。

值得注意的是,与上一代相比,这些新的内置加速器涉及人工智能、科学计算、安全、网络、数据分析和存储等领域,其性能较前一代平均提升了53%。为了满足真实工作负载下的更高追求,加速度设计理念被引入,用以优化针对实际工作负载设计的专用加速者,以提升性能和效率。

其中,“七大算力神器”的内容如下:

英特尔高级矩阵扩展(AMX):可以显著提升深度学习工作负载,如推荐系统、中文字本识别媒体分析等,在PyTorch实时AI推理与训练中的BF16模式下提高10倍。

英特尔动态负载均衡器(DLB):通过有效地分布网络工作负载到多核线程间,并在负载不平衡时重新分配,从而实现动态负载均衡。

英特尓流水线加速技术:帮助用户快速移动存储到网络再到分析中的数据,有助于释放CPU性能并降低延迟。

英德利安数据库查询加速技术:针对数据库分析,可提高内存查询吞吐量并减少占用空间。

英德利安压缩解压缩加速技术:为企业提供增强效率应用程序吞吐量,同时减少能耗。

安全引擎:包括软件防护扩展SGX、高级安全硬件功能TDX密码操作硬件高速运算IAA平台固件弹性EPT等,为增强安全防护能力提供保障。

至强CPU Max系列:首款集成HBM记忆体的小型至强CPU,为受限于记忆体资源的大规模任务提供3.7倍性能提升同时节省能源消耗。

尽管仅靠增加核心数不足以满足真实加载下的需求,但基于Arm架构服务器GPU已经出现几款拥有70核心以上产品,比目前已发布至强可扩展处理单元具有更多核数。然而,关于这一点,一名英国公司代表陈葆立表示:“我们关注客户如何使用我们的产品,而不是越多核就越好。”

此外,还有一项名为Intel on Demand服务被推出,该服务允许客户根据自己的需求选择使用哪些额外功能,而不是一次性购买所有可能需要的一切。此举旨在让终端用户把资本支出的变成运营支出,使其能够灵活控制成本。在接受采访时梁雅莉总经理说:“如果春天季节客流量激增,比如12306铁路总局会临时购买云服务,那么这样的按需服务可以很好地满足他们瞬间变化需求。”

猜你喜欢