2016年的5月6日,英伟达发布了GTX 1080,PPT上言简意赅,"A New King",一个新王的诞生,标志着A卡落败的开端
在此之前,AMD凭借Fury X和N卡仍有但随着GTX 1080的发布,A卡再也无法和N卡旗舰正面抗衡,开启了十年落败之路
简单总结下近10年的AN之争
英伟达GTX 10系列发布之后,AMD拿不出旗舰级竞品,但发布了对标1060的甜品卡,RX 480。很有意思的是,AMD同期开始了一个叫做"red team"的营销活动,口号是"rebellion"。几年后red team营销活动没了踪迹
2017年下半年,AMD发布RX Vega,可能是A卡公版造型的巅峰。图上第一款是标准版,第二款俗称"银风,第三款俗称"银水"。侧面8pin接口处配供电指示信仰灯。Vega放在当时算是功耗比较高的卡,涡轮不太能压住,水冷可以比较好的释放这卡的潜力,总体来说略强于GTX 1080,但是和GTX 1080Ti差距比较大,A卡在这代没有完全丢失高端市场,但相比Fury X那代更为弱势
RX Vega采用了两颗HBM显存,达到8G容量。但芯片理论可以支持到4颗,不少玩家开始期待配备4颗HBM的Vega 真-完全体。上面提到的Red Team在社交媒体发声,说玩家们不着急买N卡,可以等待4颗HBM的完全体。但"完全体"一拖再拖,可见Red Team也没搞不清楚情况,很难说这是个官方宣传口子还是个半官方性质的
后来的Radeon VII就是近乎完全体了,4颗HBM,只是CU砍了4个,另外同样配备了两颗HBM的Vega 56在生命周期后半便宜的吓人,两三千就能买到,让人不禁怀疑HBM的成本是不是真有那么高
2018年,GTX生命周期结束,Geforce进入了RTX时代,一口气引入了光线追踪和AI渲染两大特性,但因为价格大涨,且当时几乎没有生态,效果也不好,玩家几乎不买账,当然从现在回头看,RTX押注的技术路线是正确的,光线追踪RT和AI渲染DLSS逐渐获得玩家的认可
我一直觉得特性功能带来的提升远大于传统性能,就比如DX11时代,那个HD5870是个什么破烂玩意,DX11带来的众多特性支持力度很低,性能损耗幅度很大,被完整版的Fermi打出翔来,当然,RTX和 DirectX 12 Ultimate 带来的 DXR 是跨时代的,它几乎从根本上解决了光照问题,AI渲染又成倍的提高了帧数,当然这个效果是在RTX技术不断迭代中逐渐显现的
2018年底,英伟达发布Titan RTX,这是最后一代Titan了,售价差不多2W,双煤气罩+比较高级感的金色配色,亮点是24G显存。那时候深度学习已经兴起,相信很多学生在实验室用过
2019年初,AMD发布了末代GCN,Vega的(几乎)完全体,Radeon VII,世界上首张7nm工艺消费级显卡,4颗HBM达到16G显存(远高于2080Ti的11G),CU从64被砍到了60。性能和1080Ti差不多,比老黄的新旗舰2080Ti差一大截,老黄还评价了Radeon VII,称其"underwhelming"
2019年,AMD发布了新甜品卡5700XT,推出了全新的RDNA系列,但老黄抢在5700XT正式上市前发布了20 Super,导致5700XT没什么价格优势。AMD发布5700XT时的境况比发布RX 480时更加糟糕,不仅高端性能落后,没有能够抗衡RTX的生态(虽说当时RTX生态也刚起步,没多大用)对甜品卡也造成了影响
这个卡其实在当时看来还是不错的,传统性能接近2070S,而2070S和2080S性能差距不大
第一代RDNA架构是2019年推出的,它取代了GCN架构,CU单元抛弃了GCN的4×SIMD16设计,改为双SIMD32单元,提升指令吞吐效率,极大地提升了计算单元在处理不规则游戏负载时的利用率。
引入了由两个CU组成的WGP作为基本调度单元,提升了处理能力。建立了全新的L0/L1/L2缓存体系,有效降低了数据访问延迟,减轻了对显存带宽的压力。此外还首次支持GDDR6显存和PCIe 4.0总线,这些改动奠定了后续RDNA GPU的基本架构。
2020年,英伟达发RDNA架构的IPC相比GCN架构提升了约25%,并在同性能下功耗比GCN降低50%,但第一代RDNA架构的显卡产品线并不完整,Radeon RX 5000系列显卡最高只有RX 5700 XT,并没有旗舰级的产品。
同样2020年老黄发布了RTX 30系显卡,旗舰型号为3090,老黄用90取代了原来Titan的位置。从30系开始,光线追踪和AI渲染逐步进入可用阶段。当时的现象级游戏《赛博朋克 m2077》成为很多人对光追的第一印象。不过在30系的生命周期里,光追体验仍限制在少部分高端显卡玩家内,AI渲染的普及速度比光追更快
2020年,稍晚于英伟达发布30系,AMD发布了RDNA2系列显卡,旗舰型号为6900XT,这是继Fury X之后,AMD首次向NV旗舰型号看齐。但6900XT只有光栅能比3090,光追和AI渲染都比不了,在RTX生态逐步可用的背景下,这种卡的地位大打折扣,极客湾更是直接说"光追不行就不是旗舰卡"
2022年,英伟达发布了3090Ti,AMD发布了6950XT,分别为3090和6900XT的同代升级,没有改变本代两家显卡之间的竞争格局
6950XT在TimeSpy跑分上和3090Ti打的有来有回
2022年,英伟达发布了RTX 40系列,代号Ada Lovelace,旗舰型号是RTX 4090,虽然4090规格和满血芯片差距较大,但仍然成为了NV近年来提升最大的产品之一,3070能打2080TI,4070S能打3090。在40系的生命周期中,RTX生态逐渐从可用变为成熟,光线追踪下放、路径追踪成为新的高端体验、AI渲染基本实现了普及
40系真是软硬件集中爆发,RTX系列里最亮眼的一代,可惜起始售价过高,4070Ti 首发价格6499,将直面618跌价到同样价位的7900XTX
2022年底,AMD发布RDNA3系列,旗舰型号为7900XTX。不同于6900XT的风光,7900XTX差了不止一点半点,光栅、光追性能相比NV被拉大,AI渲染生态几乎没有,其中的矩阵单元被用户戏称为电阻丝,不知道AMD是如何规划产品的,最后只能靠降价错位竞争,原本用来对标4080的79XTX根本对标不了4080,只能降价,错位竞争去吊打秒杀降维打击4070TI的样子
RDNA 3的新计算单元设计
![]()
RDNA 3的Chiplets设计,图上的GPU是Navi 31
2025年初,在40系问世两年多之后,英伟达发布了RTX 50系列,代号Blackwell,旗舰型号为RTx 5090。由于工艺相比40系没什么进步,性能提升远不及30到40这么大。在50系生命周期中,RTX技术全面开花,路径追踪下放、T模型、动态多帧生成使游戏帧数成倍提升,后续还有DLSS 5和神经材质值得期待,当然中间还闹出过老黄不等式,5070+DLSS4 约等于 4090+DLSS3 这种笑话
2025年初,稍晚于RTX 50系,AMD发布了RDNA4系列,定位甜品,无高端产品,最高型号为9070XT。RDNA4在光追和AI渲染方面取得了相当大的进步,终于也算是勉强跟上了时代,官方宣称,每CU光追和AI性能翻倍,传统性能提升40%,虽然光栅性能9070XT比不过7900XTX 差不多在7900XT左右的水平,但在光追、FSR4的加持下综合体验更胜一筹。
自2018年RTX发布,到2025年AMD终于拿出了真正意义上支持光追、AI渲染的产品,滞后长达7年之久,不禁让人好奇,在这么多年里,AMD在产品规划上是不是出现了方向性错误
![]()
![]()
![]()
RDNA 4在2025年推出,目前还只有RX 9070和RX 9060系列的产品,产品线并不齐全,但可以确定的是这代真的只有这两系列的产平,没有旗舰产品和低端产品。RDNA 4放弃了上代的小芯片设计,重回单芯片方案,生产工艺也升级到台积电N4P,进一步提升核心能效。CU单元改进了双指令发射,并采用动态寄存器分配优化了显存访问延迟提高整体核心效率。
不过光追和AI单元的强化才是RDNA 4的重点,第三代光线追踪加速器采用定向边界框(OBB)取代原本的轴对齐边界框,更精确包围物体,减少无效计算。光追加速器中加入了第二个光线交叉引擎,让性能直接翻倍,还加入了专用的光线变换引擎,提升了光线遍历BVH数在较低层级时的性能。
而第二代AI加速器的FP16算力翻倍,基于稀疏性的FP16算力是原来的4倍,INT8算力是上代4倍,基于稀疏性的INT8算力则是上代的8倍多,第二代AI加速器还增加了对FP8数据类型的支持。
在强化AI性能之后,AMD推出了使用AI进行超分的FSR 4,它利用了RDNA 4架构AI加速单元的FP8 WMMA功能来确保最大超分画质质量,和FSR 3.1相比FSR 4带来了更好的图像质量,新的基于机器学习的算法有助于提高时间稳定性,更好地保留细节,减少重影,但也因如此目前仅RX 9000系列显卡能使用FSR 4,而RX 7000系列虽然也有AI加速单元,但由于不支持FP8格式所以不能用。
近10年A、N主要显卡系列已经完,部分马甲产品未列出(如RX 580、Super等)。
总结这10年的发展历程,不难看出软件生态在显卡竞争力方面正占据越来越高的地位,今后的显卡不仅仅是硬件性能的比拼,更需要在软件技术方面进行全面竞争
