图形卡
Nvidia推出最快的数据中心卡tesla t4
目录:
Nvidia宣布了其用于数据中心机器学习和推理的新GPU。 新的Tesla T4卡基于Turing架构,是当前Tesla P4模型的继任者,该模型几乎涵盖了所有主要的云计算提供商。
英伟达Tesla T4希望彻底改变数据中心
英伟达认为,特斯拉T4的速度明显高于P4 。 例如,对于语言推断,T4 比使用CPU快34倍,比P4快3.5倍以上 。 Tesla P4的最大吞吐量(对于4位整数运算)为260 TOPS,对于浮点运算为65 TOPS。 T4在标准配置文件75瓦PCI-e卡上 。
我们建议您阅读有关Nvidia Turing体系结构细节的文章
最重要的是,英伟达专门为AI推理设计了这些芯片,这使得图灵的新Tensor Core成为Tesla T4如此高效的推理工具 。 黄仁勋已经讨论了新的Tensor Core及其在游戏,渲染和AI操作中的作用。 该芯片总共具有320个Tensor Core Turing和2, 560个CUDA内核 。
除了新芯片外, Nvidia还正在推出其TensorRT软件的更新,以优化深度学习模型 。 这个新版本还包括TensorRT推理服务器,这是一种用于数据中心推理的完全容器化的微服务,可无缝连接到现有的Kubernetes基础架构。
图灵是Nvidia最具创新性的体系结构之一 ,即使在游戏市场上,它也将首次允许实时使用光线追踪来改善最前沿游戏的图形效果。
Techpowerup字体