在指令集架构的竞争激烈领域,X86、Arm和RISC-V各自展现出独特的优势,但近年来数据中心市场的竞争愈发白热化。Arm阵营正在向服务器市场进军,企图与x86和RISC-V正面对抗,而2022年底还出现了具有潜力的服务器级别RISC-V CPU,预计2023年中将开始出货。
内部竞争加剧,加上外部环境的变动,过去一年英特尔数据中心业务经历了下滑,其市场表现未能达到预期水平,这迫使英特尔寻求更具竞争力的服务器产品以扭转局势。
1月11日,英特尔正式发布了至强可拓展处理器(代号“Sapphire Rapids”)以及推出了英特尔至强CPU Max系列(代号“Sapphire Rapids HBM”)和英特尔数据中心GPU Max系列(代号“Ponte Vecchio”)。这些新产品家族有何性能优势?是否能够在未来助力英特尔夺回数据中心处理器的第一位位置?
新添七大算力神器,不仅核心数不是唯一答案
自2017年英特ル推出了第一款至强可扩展处理器以来,他们已经向全球客户交付超过8500万颗至强可扩展处理器,以支持全世界的数据中心。其中,在过去两年里第三代Intel 至强可扩展处理器已累计出货1500万颗。
Intel 至强可扩展处理器采用Intel 7制程工艺制造,并且拥有全新的芯片架构,它们支持每个插槽最多60个内核,以及每个系统1、2、4或8个插槽,每个插槽有80个PCIe Gen5通道,并搭配DDR5内存和CXL 1.1等新技术,以支持高带宽和附加加速效率。
值得注意的是,与上一代相比,这些新型processors除了核心数持续增加之外,还引入了新的内置加速者,涉及人工智能、科学计算、安全网络分析等多种领域,其性能较前一代平均提升1.53倍。
为了满足实际工作负载下的性能需求,上述processors采用了一种针对实际工作负载优化加速设计理念,并通过系统级设计方法,在CPU芯片架构中内置专用的工作负载加速者,以提升性能并提高效率。在发布会上,该公司总结为七大算力神器:
Intel 高级矩阵扩展(AMX)
可以显著提升深度学习工作负载,如推荐系统自然语言理解图像识别媒体流分析等方面。此外,它结合通用CPU计算单元,可以端到端运行任何AI工作负载。
Intel 动态负载均衡器(DLB)
用于分布式网络任务之间高效地分配加载,同时实现动态重排序以提高整体系统性能。
Intel 数据流加速器(DSA)
帮助用户在存储网络以及数据库分析中实现快速移动而增添速度,有助于释放CPU资源降低延迟提高利用率,可将性能提升1.7倍。
Intel 内存分析加速技术
针对数据库与大规模分析任务,可提高查询吞吐量减少内存占用,与前一代相比IAA 加速度性可以使RocksDB 性能翻番。
Intel 数据中心与压缩技术
提供高速压缩功能以减少所需空间与能耗,使企业能够保障性能同时进行安全措施。
Intel 安全引擎
包括SGX TDX密码操作硬件软件防护等功能,为增进安全防御能力提供增援。
Intel 至强CPU Max系列
首款集成HBM 的Intel 至强处理平台,为受限于内存设备使用场景提供3.7倍以上的提升同时节约能源消耗。
尽管这次更新主要聚焦于核心数量,但基于Arm 架构服务器GPU 已经展示过70核甚至更多核心数产品,这也表明超多核仍然是取得最佳结果的一条路径。但据公司表示,他们更关注如何让客户利用他们生产出来的人工智能解决方案,而不仅仅是追求更多核心。这意味着即便ARM 可以堆叠大量的心脏,也不能保证它们能够匹敌同样数量的心脏但由不同厂商生产出的效果,因为人们可能会选择那些被认为能够带来更快结果的心脏而非简单增加数量的手段。而且现在很多用户并不一定需要50% 的额外功率,只要能得到3,5,6或者13 倍以上就足够了,从而证明添加一个特殊定制心脏远胜过再多一个普通的心脏。这就是为什么这一策略对于一些关键应用来说非常有效。
此外,还有一项名为按需服务(Intel on Demand)的创新项目旨在根据客户需求灵活调整其服务范围,使得原本作为资本支出的计算资源转变成为运营支出的方式,让终端用户根据真实需求控制购买计算资源。此举允许客户随时根据自己的业务发展情况选择开启或关闭不同的服务,比如春季交通高峰期间铁路部门可能需要临时增加云服务,然后恢复到平常使用自身设施进行日常运作。