图形卡

AMD的Polaris架构详细介绍

目录:

Anonim

终于有了“ 北极星 ”架构下的新型AMD GPU,在分析了RX 480的性能之后,我们将从技术角度出发,而不是传统的比较表,数量和性能来研究本文。我们如何使用

我们不会过多地进行汇总,并且会将本文分为几部分。 首先,也是最重要的一点,我们将使用RX480的示意图来查看新的GCN 4.0方案,我们将讨论其前端和所经历的修改,中间部分(例如着色器,内存控制器等),以及次要的但不重要的部分。它的相关性。 让我们开始吧…

RX480图。 “ Polaris”的所有荣耀。

仅看一眼,我们就无法避免想到以前中端产品的相关GPU R9 380 / 380X,因为该方案的组成和位置与构成新“北极星”的元素极为相似。

关于异步计算的讨论很多,但是一切都表明它在虚拟现实(从VR起)以及低级api( Directx 12Vulkan )中将变得更加突出,但这是我们没有讨论的另一个主题。但是“ Polaris”带来的消息以及我们将与他们在一起的消息。

我们建议您阅读有关最佳显卡的指南

新的前端方案具有4个异步计算引擎( ACE )和两个新的HWS单元(硬件调度程序),或者被翻译成我们的语言,即硬件程序员。

HWS将始终为特定任务提供着色器,这是访问这些着色器的最高优先级 。 这种完整而复杂的操作对于新的低级api(DX12和Vulkan)或VR至关重要,因为很难保证可用资源使计算任务复杂化,例如音频处理,规划处理并管理计算任务和图形之间的资源平衡,从而减少了对CPU的依赖。 这些单元中的每一个都可以单独访问整个GPU

这些新单元可通过微码访问,即它们是可编程的,AMD可以更新其操作。 支持它的游戏或软件将逐渐出现,程序员将利用其功能。 这些单元可用于480、470和460甚至无切口的情况。

计算单元和几何引擎。

计算单元的着色器系统保持不变,每个着色器有64个着色器。 在RX480中,我们有一个36个CU的方案,总共提供2304个着色器

我们的改进主要在缓存和预取(预读)方面,使指令的存储更加高效。 2级缓存已从768K增加到2Mb,并且除了可以更高效地进行访问外,还可以对其进行分组。

用于保存指令波的缓冲区要大得多,并且是等待任务的缓冲区。 而且,新颖的是,我们具有执行Fp16Int16操作的本机能力。 关于夏威夷架构,AMD告诉我们,与Polaris相比,我们每个块的性能提高了15%

最后,最令人期待的改进之一来自几何引擎。 带来新的“ 原始丢弃加速器 ”。 该单元的简单任务是不加载对象后面或足够小以至于不可见的几何图形,使用其管道快速丢弃对其他将永远受益的任务无用的任务用户体验,即获得效率和性能。

查看上图,我们看到如何添加“索引缓存”,这对于实例几何来说基本上是少量的内存,也就是说,对于在屏幕上一遍又一遍地重复的对象或事物,它可以防止使用二级高速缓存,此信息可以存储在本地,从而再次提高了内存带宽和效率。

内存和色差压缩。

与老版本的R9 285一样,发布了色彩压缩系统以节省内存带宽,这是带宽“小”或不像高级机型那么大的GPU的理想技术。

新型RX 480的总带宽为256Gb / s ,这一数字远高于前几代产品,例如380X约为180Gb / s,但这反过来又是一个数字。低于290,其中AMD表示“ Polaris”由于带宽增加和颜色压缩而在实践中效率更高,带宽更有效。 据AMD称,这种差异将节省多达40%的能源

这是由于L2高速缓存存储器的增加以及它在14nm Fin Fet中的新制造工艺所致,但这实际上是由于其新的压缩系统具有2/4/8:1的比率。 每次可以压缩数据时,它都会较小程度地存储在缓存中,以节省能源,并与大量内存(例如8Gb gDDR5)兼容。

我们建议在笔记本电脑上使用AMD XConnect宣布台式机GPU

连接性和视频。

Nvidia的“ Pascal”架构和新的AMD的“ Polaris”都更新了其卡的所有连接性,具有多达3个DisplayPort端口和与HDR (高动态范围)视频兼容的HDMi 2.0 rev.B ,可用带宽高达18Gbps,最大分辨率为4K @ 60Hz ,分辨率是当前标准的4倍。

至于音频,它可以提取32个声道,以实现更大的空间沉浸感。

DisplayPort已更新至1.4版,以确保使用显示流压缩获得更好的色彩,从而带来极高的分辨率,例如8K ,刷新率高达60Hz,并为支持HDR的4K显示器带来120Hz

整个“ Polaris”范围都支持HDR,这对于显示更好的像素,更宽的色彩范围和对比度非常重要。 在整个2016年(尤其是2017年),支持该技术的显示器和电视将投放市场,这对电影爱好者来说尤其重要,因为Ultra HD Bluray标准将与之一同出现,并且也与HDR兼容。

不仅电影观众会喜欢这项技术,而且最苛刻的游戏玩家也会喜欢它!

总而言之,我们对著名的越野Graphic Core Next体系结构进行了更新,更新了最关键的部分,例如处理镶嵌的几何单元,用于异步计算的最准确的HWS单元,而不是放置了太多的ACE以及节省带宽。 它是通常具有这些类型卡的潜力和价格可承受的GPU,我们很快就会开始看到成熟的驱动程序可以利用此处介绍的技术以及各种型号的大量出现的驱动器实现其真正的性能。自定义'。

这些是我们最喜欢的部分,希望许多未知的问题能够得到解决,但是我们为您提供了包含该体系结构所有介绍的图像库,以便您比到目前为止所进行的分析更为详细。

记住,您可以对我们对AMD Radeon RX 480 (中高端显卡的新型AMD炸弹)的评论发表意见。

待会见!

图形卡

编辑的选择

Back to top button