关于巡回演出的新细节
目录:
Nvidia的 Turing架构是20年来图形学上最大的飞跃之一,我们将回顾这种现代GPU架构为游戏提供的最大创新。
图灵最有趣的新闻
CUDA 10 :CUDA 10包括对Turing GPU,性能优化的库,新的异步任务图形编程模型, CUDA互操作性和改进的图形API以及新开发工具的支持。 CUDA 10还提供了所有必要的组件, 以为Nvidia最强大的服务器平台创建应用程序 ,以用于现场(DGX-2)和云中的高性能计算(HPC)和AI工作负载( HGX-2)。
我们建议阅读有关什么是Nvidia扫描仪及其工作原理的文章
TensorRT 5-候选版本 :TensorRT 5 通过新的优化 ,API和对GPU Turing的支持,提供的推理性能比CPU快40倍 。 在推荐程序,神经机器翻译,语音和自然语言处理等应用程序中,极大地优化了混合精度推理。
cuDNN 7.3-使用cuDNN 7.3的深度学习框架可以利用Turing架构的新功能和性能来提供更快的培训性能。
NCCL 2.3 :使用NCCL 2.3和更高版本的深度学习框架可以利用Volta和Turing架构的新功能和性能来提供高性能和高效的多节点,多GPU深度学习扩展。 新功能包括针对小消息大小的改进的低延迟算法,以及何时使用GPU Direct P2P和RDMA的更精确控制。
CUTLASS 1.1 :允许开发人员使用Turing Tensor内核在CUDA C ++中进行高性能矩阵乘法 。 新功能包括对CUDA 10的支持以及新的失真矩阵功能,以访问Turing的子字节功能,从而能够以超低的精度进行深度学习研究。
VRWorks Graphics 3.0 -VRWorks图形功能面向游戏和应用程序开发人员,使视觉逼真度,性能和对虚拟现实的响应能力达到了新的水平 。 该版本与基于Turing的GPU相结合,带来了许多新技术,包括可变速率着色和多视图渲染。
Nsight Compute 1.0 :是提供交互式CUDA API和内核配置文件的下一代工具。 此版本的Nsight Compute提供了详细性能指标的快速数据收集,以及通过用户界面和命令行工具进行的API调试。
Nsight Systems 2018.2-是一种低性能分析工具,旨在提供开发人员优化其软件所需的见解,例如识别CPU和GPU瓶颈。 Nsight Systems 2018.2中的更新包括CUDA 10支持,命令行界面增强功能(包括新的使用场景)以及各种兼容性和可用性改进。
Nsight Graphics 2018.5-是一个独立的开发人员工具,可让您调试,创建配置文件并导出使用流行的图形API创建的图表 。 版本2018.5公开发布了GPU Trace,增加了对Direct3D 12 DXR和Vulkan Ray Tracing扩展的支持,扩展了像素历史记录功能以覆盖DirectX 12,并与Windows RS3 DirectX 12 SDK完全兼容。
Nsight VSE 6.0-是一个GPU应用程序开发环境,可让您创建,调试,分析和跟踪各种应用程序 。 Nsight VSE 6.0的更新包括具有射线跟踪和调试支持的图形调试,以及具有CUDA 10支持的增强的计算分析。