4D只是开始：AMD Radeon HD 6900新架构官方图解

编辑：无锡美锦群创精密科技有限公司时间：2019/06/05

AMD昨日在波兰举行了一场内部交流会，向当地媒体讲解了Radeon HD 6900系列显卡的全新架构设计。虽然经历了泄露、删除的风波，不过我们还是保存了其中的关键部分。

有趣的是，这些幻灯演示上标注的解禁时间为2010年10月份，证明Radeon HD 6900系列确实曾经打算上个月就面世，但因为种种原因而推迟到了下个月。

Cayman Radeon HD 6900、Barts Radeon HD 6800两个系列虽然如此之近，但却基于两种截然不同的核心架构。Radeon HD 6800延续着R600以来的5D式流处理器设计，或者叫VLIW5，四个简单加一个复杂流处理器组成一个SIMD单元；Radeon HD 6900则改成了4D式设计，又叫VLIW4，每组SIMD单元包括四个均等的中型流处理器，外加一个通用目的光栅单元和一个分支单元。

除此之外，Cayman Radeon HD 6900核心还有更多SIMD阵列和纹理单元、双图形引擎、第八代曲面细分、改进的渲染后端、新的GPU计算能力、增强质量抗锯齿（EQAA）、带宽超过 5Gbps的高速256-bit GDDR5显存界面等等，下边我们会一一讲解。

VLIW4 4D式架构采用四路并发设计，所有的流处理器都具有相同的整数、浮点操作执行能力（不再有T-Unit），不过其中两个还是附加了一些特殊功能。

AMD宣称，VLIW4架构相比于VLIW5能将核心面积减少大约10％，同时简化调度和光栅管理，逻辑核心也得到了大范围的重新利用。

虽然家构图上没有标明Cayman Radeon HD 6900核心有多少个这种流处理器，但根据此前消息双芯的Radeon HD 6990会有3840个，那么顶级单芯Radeon HD 6970自然就是1920个了，也就是30个SIMD阵列引擎。

前端设计方面，Cayman Radeon HD 6900核心使用了两个图形引擎，每时钟周期可处理两个原语（Primitive），具备基于区块的负载均衡，转换和隐面消除率翻番。

同时两个光栅器单元，每时钟周期最多可处理32个像素；

以及两个第八代曲面细分单元（Barts Radeon HD 6800是第七代），支持更高曲面细分等级的片外缓冲以提高性能，相比Radeon HD 5870提升最多三倍。

曲面细分技术因为厂商的宣传而成为DX11的热点，AMD此番更是将其进化到第八代，并宣称自己的做法才是正确的，包括专注于最有效的曲面细分使用模型、自适应曲面细分等等，可以做到性能与画质的平衡。

在不同曲面细分因数下，Radeon HD 6970的曲面细分性能可以达到Radeon HD 5870的1.5-3.0倍。

渲染器后端的改进包括写入操作合并、16位整数（unorm／snorm）操作速度提升2倍、32位浮点（单／双精度）操作速度提升2-4倍。

GPU计算增强包括异步分配（多个计算内核同步执行／每个内核拥有自己的命令队列和受保护虚拟寻址域）、两个双向DMA引擎（加快系统内存读写速度）、着色器读取操作合并、LDS（本地数据共享）直接拾取、改进的流控制、更快的双精度操作（单精度的四分之一）。

增强质量抗锯齿（EQAA）是一种新的多重采样抗锯齿（MSAA），每像素最多16个采样点，色彩和采样点数量可以独立控制，而且能够自行配置采样模式和过滤器。

AMD宣称该技术能够在使用同样容量显存的基础上带来更好的画质，而且兼容自适应AA、超级采样抗锯齿（SSAA）、形态抗锯齿（MLAA）。

随着核心面积的增大，功耗控制也越发重要。Radeon HD 6900会集成一颗功耗控制处理器，每个时钟周期都会实时监控功耗并进行动态调整，而且可以直接工制GPU核心功耗，不再绕过频率、电压调整，此外也支持AMD OverDrive工具。

Radeon HD 6970的最终规格仍未明确公布。每时钟周期处理三角形数量为两个（Radeon HD 5870一个）；Z／Stencil ROP单元、Color ROP单元分别仍是128个和32个；SIMD引擎、纹理单元只说分别大于20个和80个，猜测应该是30个和120个；显存带宽大于160GB／s，说明显存等效频率确实会超过5Gbps。

上一条：费米二代第二波：GeForce GTX 570下月发布

下一条：华硕首推3TB硬盘容量限制软件解决方案

Back