图形卡

英伟达宣布推出用于人工智能的tesla p40和tesla p4

目录:

Anonim

英伟达(Nvidia )宣布推出了基于Pascal架构的新型Tesla P40和Tesla P4图形卡以及新软件,该软件有望在苛刻的人工智能领域提高效率和速度。

Nvidia Tesla P40和Tesla P4在人工智能方面取得了巨大进步

语音协助,垃圾邮件过滤器和内容推荐服务等许多现代人工智能 (AI)服务的复杂性正经历着巨大的增长,其计算能力比一年前提高了10倍。 在这种情况下, 当前的CPU无法提供足够的功率,因此GPU越来越成为焦点。

我们建议您阅读我们的虚拟现实设置

新的Nvidia Tesla P40和Tesla P4卡经过专门设计,可在人工智能场景(例如语音,图像或文本识别)中提供最佳性能,以实现最快的响应速度。 这些新卡基具有8位指令(INT8)Pascal架构,能够提供功能最强大的CPU的45倍性能和上一代GPU的4倍性能。 Tesla P4的起始功耗仅为50W ,其工作效率是CPU的40倍,只有其中一张卡的服务器可以代替多达13台基于CPU的服务器来执行视频推理任务,这意味着总成本节省8倍。

就其本身而言, Tesla P40凭借其令人印象深刻的每秒47兆操作次数(TOPS)在深度学习场景中提供了最佳性能 ,其中有八张卡的服务器能够替换多达140个基于CPU的服务器, 为服务器节省了超过65万美元的购置成本

新的TensorRT和NVIDIA DeepStream SDK软件可实现最佳性能

除了Tesla P40和Tesla P4之外,还发布了两个新软件NVIDIA TensorRT和NVIDIA DeepStream SDK,以加速人工智能推理操作。

TensorRT是一个用于优化深度学习模型 ,旨在在最复杂的网络情况下提供即时响应。 通过其16位和32位运算以及8位精度运算, 最大限度地提高深度学习的效率和性能

我们建议针对游戏玩家最佳显卡发表文章。

就其本身而言, NVIDIA DeepStream SDK提供了整个服务器的功能,可以同时实时实时解码和分析多达93个高清视频流,与具有两个CPU的服务器可以处理的7个流相比,这是一个突破。 通过允许对自动驾驶系统,交互式机器人,内容过滤器和深度学习等进行视频理解操作,这代表了人工智能领域的巨大进步。

规格 特斯拉P4 特斯拉P40
单精度FLOPS * 5.5 12
INT8 TOPS *(每秒的运算次数) 22 47
CUDA核心 2, 560 3, 840
记忆体 8GB 24GB
记忆体频宽 192GB /秒 346GB /秒
能量 50瓦(或更高) 250瓦
我们建议您宣布EVGA GeForce GTX FTW2卡的防水装置

资料来源:videocardz

图形卡

编辑的选择

Back to top button