安卓系统

d Amd vega

目录:

Anonim

AMD Vega是AMD最先进的图形架构的名称,它是GCN的最新发展,它自2011年以来一直伴随着我们的GPU架构。GCN的这一发展是AMD迄今为止最雄心勃勃的。

您想要了解更多有关AMD VEGA显卡及其所有功能的信息吗? 在这篇文章中,我们回顾了GCN架构的所有关键以及Vega隐藏的所有秘密。

内容索引

GCN架构的诞生及其演变直至到达Vega

要了解AMD在显卡市场上的历史, 我们必须追溯到2006年,当时桑尼维尔公司接管了已经运营多年的全球第二大显卡制造商 ATI 。与行业领导者Nvidia搏斗。 AMD以43亿美元现金和5800万美元股票(总价值54亿美元)的价格购买了ATI的所有技术和知识产权,并于10月25日完成诉讼, 2006年。

当时ATI正在开发使用统一着色器的第一个GPU架构 。 在此之前,所有图形卡内部都包含用于顶点和着色处理的不同着色器。 随着DirectX 10的到来,支持统一的着色器,这意味着GPU中的所有着色器都可以毫无差别地处理顶点和阴影。

TeraScale是ATI在设计时支持统一着色器的体系结构第一个使用此架构的商业产品是Xbox 360视频控制台,其GPU名为Xenos,由AMD开发,并且比当时PC上的安装要先进得多。 在PC世界中,TereaScale使Radeon HD 2000、3000、4000、5000 和6000系列的图形卡栩栩如生 。 随着制造工艺的不断发展,从90纳米发展到40纳米,他们都在不断进行细微的改进以提高其性能。

与Nvidia相比,岁月流逝,TeraScale体系结构已过时 。 TeraScale在视频游戏中的性能仍然很好,但是与Nvidia相比 ,它有一个很大的弱点,这是使用GPGPU进行计算的能力低下 。 AMD了解到,需要设计一种新的图形架构,使其能够在游戏和计算领域与Nvidia对抗,这一部分变得越来越重要。

我们建议阅读我们最好的 PC硬件和组件指南

  • 绿色巨人的AMD历史,处理器和图形卡

GCN是AMD从头开始设计的图形架构,用于接替ATI的TeraScale

Graphics Core Next是第一个由AMD 100%设计的图形体系结构的名称 ,尽管从逻辑上讲,从ATI继承的所有内容对于使其开发成为可能都是至关重要的。 Graphics Core Next不仅仅是一个体系结构,这个概念代表了一系列图形微体系结构和一组指令的代号 。 Radeon HD 7970于2011年底问世,这是第一款基于GCN的产品,它为所有用户带来了如此出色的效果。

GCN是RISC SIMD微体系结构,与VLIW SIMD TeraScale体系结构形成对比。 GCN的缺点是与TeraScale相比,它需要更多的晶体管 ,但作为回报,它提供了更大的计算GPGPU的功能,使编译器更简单,并且可以更好地利用资源 。 所有这些使GCN的体系结构明显优于TeraScale,并且为适应市场的新需求做好了充分的准备。 第一个基于GCN的图形核心是Tahiti ,它使Radeon HD 7970栩栩如生 。 大溪地采用28纳米工艺制造, 与基于TeraScale的最新图形核心Radeon HD 6970的Cayman GPU的40纳米相比,能源效率实现巨大飞跃。

此后, GCN架构在Radeon HD 7000,HD 8000,R 200,R 300,RX 400,RX 500和RX Vega系列图形卡的几代产品上进行了一些改进Radeon RX 400s引入了14nm的制造工艺 ,使GCN的能效有了新的飞跃。 GCN架构还用于PlayStation 4和Xbox One的APU图形核心中,它们是Sony和Microsoft当前的视频游戏机,以其价格提供出色的性能。

GCN架构在内部组织为我们所谓的计算单元(CU) ,这是该架构的基本功能单元。 AMD设计具有更多或更少计算单元的GPU,以创建其不同范围的图形卡 。 反过来,可以停用这些GPU中的每个GPU中的计算单元,以基于同一芯片创建不同范围的图形卡。 这使我们能够利用制造过程中出现的硅在某些计算单元中存在问题的优势,这已经在行业中进行了很多年。 Vega 64 GPU内部具有64个计算单元,是迄今为止AMD生产的功能最强大的GPU。

每个计算单元将64个着色处理器或着色器与内部4个TMU组合在一起 。 计算单元与处理输出单元(ROP)分开但由其供电。 每个计算单元包括一个调度程序CU,一个分支和消息单元,4个SIMD向量单元,4个64KiB VGPR文件,1个标量单元,4个KiB GPR文件,64 KiB的本地数据配额,4个纹理过滤器单元,16个纹理恢复负载/存储单元和16 kB L1缓存。

AMD Vega是GCN最具雄心的演变

GCN架构的不同代之间的差异非常小 ,彼此之间的差异也不大。 第五代GCN架构(称为Vega)是一个例外 ,它极大地修改了着色器以提高每个时钟周期的性能。 AMD自2017年1月开始发布AMD Vega的详细信息,从一开始就引起了人们的高度期望。 AMD Vega增加了每个时钟的指令,达到了更高的时钟速度,提供了对HBM2内存的支持以及更大的内存地址空间。 所有这些功能使您至少在纸面上可以显着提高前几代的性能。

架构上的改进还包括新的硬件程序员,新的原始废弃加速器,新的显示驱动器以及更新的UVD,它们可以以4K分辨率以 每秒 60i 帧的速度,以每个颜色通道10位质量解码HEVC 。 。

计算单元经过大量修改

由Raja Koduri领导的AMD Vega开发团队修改了计算单元的基本平面,以实现更具攻击性的频率目标 。 在以前的GCN架构中,存在一定长度的连接是可以接受的,因为信号可以在单个时钟周期内传播整个距离。 Vega必须缩短其中 一些 流水线的长度,以便信号可以在时钟周期的范围内遍历它们 ,而在Vega中则要短得多。 AMD Vega的计算单元被称为NCU,可以将其转换为新一代计算单元。 为了减少AMD Vega的流水线长度, 对指令的搜索和解码逻辑进行了修改 ,并对其进行了重构,以满足新一代图形卡缩短执行时间的目标。

在L1缓存纹理解压缩数据路径上,开发团队向流水线添加了更多步骤,以减少每个时钟周期完成的工作量,从而达到提高工作频率的目标。 增加级是提高设计的频率容限的常用方法。

快速分组数学

AMD Vega的另一个重要新颖之处在于,它支持对精度较低的两个操作(FP16)进行同时处理,而不是精度较高的单个操作(FP32) 。 这就是称为快速数据包数学的技术。 Rapid Packet Math是AMD Vega中最高级的功能之一,在以前的GCN版本中没有。 这项技术可以更有效地利用GPU的处理能力,从而提高其性能 。 PlayStation 4 Pro是受益于Rapid Packet Math的最大设备,并通过其一款明星游戏Horizo​​n Zero Dawn做到了这一点。

Horizo​​n Zero Dawn是Rapid Packet Math可以带来的一个很好的例子该游戏使用这项先进的技术来处理与草有关的所有内容 ,从而节省了开发人员可以用来改善游戏其他元素的图形质量的资源。 Horizo​​n Zero Dawn 从一开始就以其压倒性的图像质量而受到影响,以至于令人印象深刻的是,仅400欧元的游戏机就可以提供如此艺术的部分。 不幸的是,Rapid Packet Math尚未在PC游戏中使用 ,这主要归咎于它是Vega的独有功能,因为开发人员不想将资源投资于很少有用户能够利用的东西。 。

原始着色器

AMD Vega还增加了对新的Primitive Shaders技术的支持,该技术提供了更灵活的几何处理,并替换了渲染管道中的顶点和几何着色器。 这项技术的想法是从场景中消除不可见的顶点,以便GPU不必计算它们,从而降低了图形卡的负载水平并提高了视频游戏的性能 。 不幸的是,这项技术需要开发人员进行大量工作才能利用它,并且它发现的情况与Rapid Packet Math非常相似。

AMD打算在驱动程序级别实施基本着色器,这将使该技术能够神奇地工作 ,而无需开发人员执行任何操作。 这听起来很不错,但由于无法在DirectX 12和其他当前API 中实现 ,因此最终无法实现 。 原始着色器仍然可用,但是必须由开发人员为其实施投入资源。

ACE和异步着色器

如果我们谈论AMD及其GCN架构,我们必须谈论异步着色器,这个术语在很久以前就被讨论过了,但是几乎什么也没说了。 异步着色器指的是异步计算 ,这是AMD旨在减少其带有几何图形的显卡所遭受的缺陷的一项技术

基于GCN架构的AMD图形卡包括ACE(异步计算引擎),这些单元由专用于异步计算的硬件引擎组成,它是一种占用芯片空间并消耗能量的硬件,因此其实施不是一时兴起,而是必要。 存在ACE的原因是,当在不同的计算单元和构成它们的核之间分配工作负载时,GCN的效率很差 ,这意味着许多核处于工作状态,因此虽然被浪费了,但却被浪费掉了。消耗能量。 ACE负责对这些仍处于失业状态的核进行工作,以便可以使用它们。

尽管在这方面,AMD Vega架构的几何结构已得到改进,但仍远远落后于Nvidia的Pascal架构。 GCN的几何效率不佳是AMD较大的芯片无法提供预期结果的原因之一 ,因为随着芯片的增大,GCN架构的几何效率越来越低。并包含更多的计算单位。 借助新的图形架构,改善几何形状是AMD的关键任务之一。

HBCC和HBM2内存

AMD Vega架构还包括高带宽高速缓存控制器(HBCC) ,Raven Ridge APU的图形内核中没有该功能。 该HBCC控制器可以更有效地使用基于Vega的图形卡的HBM2内存。 此外, 如果HBM2内存用完 ,它还允许GPU访问系统的DDR4 RAM 。 HBCC使得这种访问可以更快,更有效地完成,与上一代产品相比,其性能损失更少。

HBM2是用于图形卡的最先进的内存技术 ,它是第二代高带宽堆叠式内存。 HBM2技术将不同的存储芯片堆叠在一起,从而形成了极高密度的封装 。 这些堆叠的芯片通过互连总线相互通信,该互连总线的接口可以达到4, 096位。

这些特性使HBM2存储器具有比GDDR存储器更高的带宽 ,而且电压和功耗也低得多。 HBM2内存的另一个优点是,它们非常靠近GPU放置,从而节省了图形卡PCB上的空间并简化了其设计。

关于HBM2存储器的坏处是它们比GDDR昂贵得多,使用起来也更困难。 这些内存通过插入器与GPU进行通信,插入器的制造成本非常高,并且使图形卡的最终价格更加昂贵。 结果,与基于GDDR内存的图形卡相比,基于HBM2内存的图形卡的制造成本要高得多。

HBM2内存的高昂价格及其实现以及比预期低的性能一直是AMD Vega在游戏市场上失败的主要原因 。 AMD Vega的性能未能超过GeForce GTX 1080 Ti,后者是基于Pascal架构而将近两年前的显卡。

当前基于AMD Vega的显卡

AMD目前在Vega架构下的图形卡是Radeon RX Vega 56和Radeon RX Vega 64 。 下表列出了这些新显卡的所有最重要的功能。

当前的AMD Vega显卡
显示卡 计算单元/着色器 基本/加速时钟频率 内存量 记忆体介面 记忆类型 记忆体频宽 技术开发计划
AMD Radeon RX Vega 56 56 / 3, 584 1156/1471 MHz 8 GB 2, 048位 HBM2 410 GB /秒 210瓦
AMD Radeon RX Vega 64 64 / 4, 096 1247/1546兆赫 8 GB 2, 048位 HBM2 483.8 GB /秒 295瓦

AMD Radeon RX Vega 64是当今面向游戏市场的功能最强大的AMD图形卡 。 该卡基于Vega 10芯片,由64个计算单元组成,可转换为4, 096个着色器,256个TMU和64个ROP 。 该图形内核能够以295W的TDP以高达1546 MHz的时钟频率工作

图形核心随附两个HBM2内存堆栈,这些堆栈总共有8 GB,带有4, 096位接口,带宽为483.8 GB / s 。 它是一种具有非常大核心的图形卡,是AMD制造的最大的图形卡,但除了消耗更多的能源和生产能力外,其性能无法达到GeForce GTX 1080 Ti Pascal GP102核心的水平。更多的热量。 AMD无法与Nvidia对抗的事实似乎清楚地表明,GCN架构需要更大的发展才能与Nvidia的显卡保持一致。

AMD Vega的未来将经历7nm

通过采用7纳米制造工艺AMD将为AMD Vega架构注入新的活力 ,这意味着与当前14纳米设计相比,能源效率将得到显着提高。 目前,AMD Vega(7纳米)将不会进入游戏市场,但将专注于人工智能领域,后者将转移大量资金 。 尚未了解有关7nm的AMD Vega的具体细节,能效的提高可用于维持当前卡的性能,但功耗要低得多,或者使新卡的功能更加强大。与当前消耗量相同。

Radeon Instinct是首批在7nm处使用AMD Vega的显卡。 Vega 20是第一款7nm的AMD GPU,它是图形内核,提供的晶体管密度是当前Vega 10硅的两倍,Vega 20芯片的尺寸约为360mm2,这意味着尺寸的减小与尺寸为510mm2的Vega 10相比,其表面积为70% 。 这一突破使AMD能够提供新的图形核心,时钟速度提高20%,能源效率提高约40%。 Vega 20的功率为20.9 TFLOP,使其成为迄今为止发布的功能最强大的图形内核 ,甚至比Nvidia提供15.7 TFLOP的Volta V100内核要强得多,尽管该内核是在12纳米制程下制造的,在这方面,AMD拥有明显的优势。

到此为止,我们在AMD Vega上的帖子。 请记住,您可以在社交网络上与您的朋友分享此信息 ,以这种方式您可以帮助我们传播它,从而可以帮助更多需要它的用户。 如果您还有其他要添加的内容或在我们的硬件论坛中给我们留言,您也可以发表评论。

安卓系统

编辑的选择

Back to top button