英伟达宣布推出用于人工智能的tesla p40和tesla p4

Nvidia Tesla P40和Tesla P4在人工智能方面取得了巨大进步

语音协助，垃圾邮件过滤器和内容推荐服务等许多现代人工智能 （AI）服务的复杂性正经历着巨大的增长，其计算能力比一年前提高了10倍。在这种情况下， 当前的CPU无法提供足够的功率，因此GPU越来越成为焦点。

我们建议您阅读我们的虚拟现实设置 。

新的Nvidia Tesla P40和Tesla P4卡经过专门设计，可在人工智能场景（例如语音，图像或文本识别）中提供最佳性能，以实现最快的响应速度。这些新卡基于具有8位指令（INT8）的Pascal架构，能够提供功能最强大的CPU的45倍性能和上一代GPU的4倍性能。 Tesla P4的起始功耗仅为50W ，其工作效率是CPU的40倍，只有其中一张卡的服务器可以代替多达13台基于CPU的服务器来执行视频推理任务，这意味着总成本节省8倍。

就其本身而言， Tesla P40凭借其令人印象深刻的每秒47兆操作次数（TOPS） ， 在深度学习场景中提供了最佳性能 ，其中有八张卡的服务器能够替换多达140个基于CPU的服务器， 为服务器节省了超过65万美元的购置成本 。

新的TensorRT和NVIDIA DeepStream SDK软件可实现最佳性能

除了Tesla P40和Tesla P4之外，还发布了两个新软件NVIDIA TensorRT和NVIDIA DeepStream SDK，以加速人工智能推理操作。

TensorRT是一个用于优化深度学习模型的库，旨在在最复杂的网络情况下提供即时响应。通过其16位和32位运算以及8位精度运算， 最大限度地提高深度学习的效率和性能 。

我们建议针对游戏玩家的最佳显卡发表文章。

就其本身而言， NVIDIA DeepStream SDK提供了整个服务器的功能，可以同时实时实时解码和分析多达93个高清视频流，与具有两个CPU的服务器可以处理的7个流相比，这是一个突破。通过允许对自动驾驶系统，交互式机器人，内容过滤器和深度学习等进行视频理解操作，这代表了人工智能领域的巨大进步。

规格	特斯拉P4	特斯拉P40
单精度FLOPS *	5.5	12
INT8 TOPS *（每秒的运算次数）	22	47
CUDA核心	2, 560	3, 840
记忆体	8GB	24GB
记忆体频宽	192GB /秒	346GB /秒
能量	50瓦（或更高）	250瓦

我们建议您宣布EVGA GeForce GTX FTW2卡的防水装置

资料来源：videocardz

目录:

Nvidia Tesla P40和Tesla P4在人工智能方面取得了巨大进步

新的TensorRT和NVIDIA DeepStream SDK软件可实现最佳性能

编辑的选择