硬件

Nvidia宣布dgx

目录:

Anonim

NVIDIA推出的超级计算机DGX-2以多种方式建立在先前的DGX-1的基础上,但性能却高出一倍 。 首先,它引入了NVIDIA的新NVSwitch,它能够以PCIe连接速度12倍的速度进行300GB / s的芯片间通信 。 借助NVLink2,可将16个GPU分组到一个系统中,从而使总带宽超过14TB / s。 根据NVIDIA的说法,加上一对Xeon CPU,1.5TB RAM和30TB NVMe存储容量,我们得到的系统消耗10 kW功率,重350 lbs,但性能却是DGX-1的两倍。

DGX-2的功能是DGX-1的2倍

使用张量核心时, NVIDIA还从2种性能PFLOP中脱颖而出

这家绿色公司使用了双重堆叠系统。 概念图表明系统中实际上有12个NVSwitch (216个端口),以最大程度地利用GPU之间的可用带宽。 每个Tesla V100 GPU有6个端口,每个端口运行在32GB的HBM2内存上 ,这意味着,如果NVIDIA将其完全布线以最大化每个GPU的带宽,那么仅Tesla便会占用这些端口中的96个。

DGX-2的设计意味着所有16个GPU都可以以统一的方式共享内存 ,尽管这与放弃芯片的通常利弊有关。 与Tesla V100增加的内存容量不同,在这种情况下,NVIDIA的目标之一是创建一个能够容纳内存工作负载的系统,而该工作负载对于8 GPU集群而言可能太大了。

DGX-2正在针对专注于深度学习并且可以做出巨大投资的公司推出。 该系统的价格为$ 400, 000,而不是原始DGX-1的$ 150, 000。

Anandtech字体

硬件

编辑的选择

Back to top button