性能暴增50NVIDIA全新显卡架构Volta解析

本文经超能网授权转载,媒体转载请经超能网同意。 NVIDIA这几年垄断了高端显卡市场,从他们的Q1季度财报中虽然也能看到Tegra、数据中心等业务有了明显增长,不过营收的主力还是游戏PC市场,Q1季度游戏PC市场营收就增长了50%,高端玩家现在买游戏显卡往往是从GTX 1080 Ti/1080/1070中选一款了。如今Pascal还未显出颓势,今天凌晨的GTC 2017主题演讲上,NVIDIA CEO黄仁勋发布了Volta架构显卡,新一轮升级又要来了。 NVIDIA能够获得现在的表现很大程度是因为他们的产品路线图比较连贯,从Kepler到Maxwell,再到现在的Pascal架构,NVIDIA每一代GPU升级都很稳定,短时间内就能完成高端到低端的布局。以Pascal这一代为例,首发的是GTX 1080、GTX 1070,接着是Titan X,陆陆续续又有GTX 1060 6GB及GTX 1060 3GB,还有GTX 1050 Ti、GTX 1050,今年3月份又有GTX 1080 Ti、Titan Xp,马上还会有GT 1030主打入门级市场——不算不知道,NVIDIA在Pascal这一代的GPU产品组合还真是挺多的。 Pascal显卡发布一年整了,产品线布局还在完善,不过大家的兴趣点现在已经开始向新一代GPU转移了,特别是今天发布了Volta架构显卡——Telsa V100,这跟去年Pascal架构首发GP100核心的Telsa P100一样,也在去年这个时候,我们撰文详细介绍了GP100核心的改进情况,今天我们也会针对GV100核心及Tesla V100显卡做更深入的探讨。 早上已经有Tesla P100的新闻发布了,大家也了解过基本情况了,我们先来看看Tesla V100加速卡的真身,这次同时展示的是两个版本的。 Tesla V100显卡真身:NVLink与PCI-E版大不同 NVLink 2接口的Tesla V100显卡 老黄手里曝光最多的就是这个短小强悍的Tesla V100,它实际上NVLink版的,跟去年的Tesla P100看着很像,毕竟这二者都使用了HBM 2显存,功耗也没有明显增加,应该是直接沿用相同的PCB电路。 PCI-E接口的Tesla V100显卡 PCI-E版的Tesla V100显卡不太引人注意,找到了上面这张照片,如果跟去年PCI-E版的Tesla P100显卡对比,可以看出PCI-E版Tesla V100显卡跟PCI-E版P100有很多不同,散热器明显小多了,体积跟NVLink版差不多。 这是去年的PCI-E版Tesla P100加速卡 Telsa V100加速卡规格:Volta架构终于来了 Tesla V100是针对HPC市场设计的,跟普通消费者没啥关系(属于吃瓜群众买不到买不起系列),之所以引人关注是因为它使用的是新一代Volta架构,首发的依然是GV100这种大核心。早上的新闻中大家也看到了它各方面规格都很惊人——815mm2核心面积、211亿晶体管、5120个CUDA核心、15TFLOPS浮点性能等等,放在当前的显卡中简直是鹤立鸡群,拿来跑游戏不知道多爽,可惜老黄不卖给消费级玩家。 NVIDIA Volta/Pascal与AMD Vega显卡的规格对比 为此我做了一个详细的规格表,对比的产品除了目前的Tesla P100和Titan Xp之外,还加入了AMD的Vega 10核心的Radeon Instinct MI25显卡,尽管还没上市,但AMD早前公布过这款显卡的一些信息,比如带宽、浮点性能,不过Vega核心的晶体管、核心面积等关键参数还是个谜。 对比GP100核心与GV100核心,可以看出后者规模进一步扩大,SM单元数量从之前的56组提升到了80组,CUDA核心数从3584个提升到5120个,计算单元数量增幅为43%。显存位宽及容量都没变化,还是16GB HBM2显存,不过频率有所提升,带宽从前代的720GB/s提升到了900GB/s,非常接近HBM 2显存理论上1024GB/s的带宽了(搭配4颗HBM显存的情况下)。 计算单元的增加也使GV100核心的规模进一步扩大——晶体管数量从目前的153亿增加到了211亿,核心面积从610mm2提升到815mm2,一举创造了NVIDIA GPU同时也是现代GPU的核心面积新纪录。NVIDIA这几代大核心虽然核心面积有涨有降,不过之前最多是在600mm2级别徘徊,这一次直接做了815

猜你喜欢