芯片资讯
- 发布日期:2024-01-06 06:38 点击次数:132
尽管英伟达和AMD(以及2006年之前的ATI)长期以来一直在争夺图形领域的霸主地位,但很明显,这个绿色巨人通常占据上风。但是,尽管英伟达有着良好的业绩和赚钱的能力,该公司还是推出了大量糟糕的GPU。外媒Tom's Hardware对英伟达 24年来最差的五款GPU进行了排名。
5 - GeForce RTX 3080
2016年,英伟达凭借其GTX 10系列轻松领先于AMD,到2020年,英伟达仍然能够保持领先地位。由于RTX 20系列忽略了传统的栅格化性能,转而注重当时小众的光线追踪和人工智能驱动的分辨率升级,使得情况变得更加复杂。在很长一段时间里,英伟达第一次陷入困境。
英伟达为RTX 30系列设计的是Ampere架构,它解决了基于Turing的RTX 20系列芯片的许多问题。英伟达从台积电的12纳米工艺(本质上是16纳米节点,但可以制造大芯片)升级到三星的8纳米工艺,这意味着增加了额外核心的密度,提高了效率。Ampere还将专用的整数执行单元设置为浮点加整数单元,这意味着它可以根据工作负载,以整数性能换取额外的浮点计算。英伟达将这一变化宣传为核心数量和TFLOPS的大幅增加,这其实有点误导。
英伟达于2020年9月推出了RTX 3080和3090,抢占了AMD RDNA 2驱动的RX 6000系列。699美元的3080和1499美元的3090差不多,在光线追踪和非光线追踪游戏中都比RTX 2080 Ti快得多。AMD售价649美元的RX 6800 XT和RX 6800于去年11月上市,RX 6900 XT于去年12月上市,虽然它们在非光线追踪场景下确实与3080和3090持平,但在光线跟踪功能方面落后,而且它们也缺乏像DLSS这样的分辨率升级版。
Tom's Hardware最初给3080打分4.5星(满分5星),所以你可能想知道它怎么会出现在这个列表上。这归结为发行日后发生的一切。3080最直接的问题是,无法以建议零售价(MSRP)买到它,而问题的很大一部分是由新冠疫情引起的GPU短缺,然后被加密货币矿工推高至远高于1500美元的价格,这大大加剧了问题。即使在2022年初技术上结束了短缺,也几乎没有3080 10GB的价格低于699美元。
与此同时,高端的RX 6000显卡,如6800 XT,以低于建议零售价的价格解决了GPU短缺问题。从去年到今年,6800 XT的建议零售价一直低于649美元,而现在它的全新售价还不到500美元。AMD现在也有FSR2,它与DLSS不完全匹配,但它是一个可行的分辨率升级和帧生成的替代方案。RTX 30卡甚至不能获得DLSS 3帧生成,而必须依赖FSR 3帧生成。
此外,RTX 30系列还有更广泛的问题。除了3060 12GB和3090 24GB VRAM外,几乎每个30系列卡的内存都比应有的要少得多。在发布当天一切都很好,但越来越多的证据显示,大多数RTX 30系列卡就是没有足够的内存,特别是在最新的游戏中。然后是RTX 3050,这是该系列中最低端的一款,建议零售价为249美元,实际价格为300美元或更多。与109美元的GTX 1050相比;仅仅两代,英伟达就将其GPU的最低价格提高了140美元。
即使没有GPU短缺,RTX 30系列似乎从一开始也注定要失败,因为它的内存有限,在光线追踪和分辨率提升方面的优势也很小。极端的零售价格足以使RTX 3080及其大多数同类卡成为英伟达最糟糕的卡,并直接导致英伟达提高其下一代部件的价格。
4 - GeForce RTX 4060 Ti
将半年前出现的GPU称为有史以来最糟糕的GPU可能还为时过早,但RTX 4060 Ti不仅本身就是一个非常糟糕的显卡,而且它是整个RTX 40系列及其所有问题的缩影。
英伟达之前的RTX 30 GPU遇到了来自AMD RX 6000系列的真正竞争对手,尤其是在中端市场。虽然RTX 3060 12GB的性能非常好,这要归功于它增加的VRAM容量,但高端的RTX 3060 Ti和3070 GPU只有8GB,即使在GPU短缺结束后,价格也没有特别引人注目。一个(上)中档RTX 40系列GPU可以平衡竞争环境。
RTX 4060 Ti确实有一些可取之处:它比30系列卡的能效要高得多,它使用了小型AD 106芯片,其密度是RTX 3070和RTX 3060 Ti内部GA104芯片的三倍。但4060 Ti有一系列的问题,主要与内存有关。
4060 Ti有两种型号:一种是8GB的VRAM,另一种是16GB的。这款GPU的8GB型号甚至存在问题,因为它的性能非常接近已经存在内存容量问题的3070。所以,显然你应该买16GB的,以确保其经得起未来的考验,不过16GB的要多花100美元。对于4060 Ti,英伟达基本上是在告诉你,你需要花499美元而不是399美元来确保你的显卡100%正常运行。
4060 Ti在其他方面也走了捷径,尤其是在内存带宽方面。英伟达给了这款GPU一个很小的128位内存总线,是3070和3060 Ti上256位总线的一半,这导致4060 Ti上的带宽只有288GB/s,而上一代的带宽是448GB/s。此外,4060 Ti有8个而不是16个PCIe通道,这应该没有太大关系,但它仍然是更小气的。更大的L2缓存有助于解决带宽问题,但也仅限于此。
最后,RTX 4060 Ti基本上只是一个RTX 3070,几乎没有任何额外的性能,良好的效率,并支持DLSS 3帧生成。当然,8GB版售价399美元,而不是499美元(现在约为449美元),但它也会遇到3070版本可能遇到的问题。这意味着你可能只需要购买16GB的型号,它的价格与即将推出的3070相同。不管怎样,都需要妥协。
RTX 4060 Ti并不是唯一糟糕的,它与RTX 40系列中看到的整体情况相呼应。到目前为止,这是英伟达最昂贵的GPU系列,从299美元起的RTX 4060到1599美元起的RTX 4090(通常要贵得多)。4060 Ti并不是唯一具有争议内存设置的40系列显卡,因为英伟达最初计划将RTX 4070 Ti作为RTX 4080 12GB推出。即使更换了名称并降价100美元,这款显卡也需要在这个列表中提及。但坦率地说,几乎所有RTX 40系列的GPU(除了光环RTX 4090)都觉得价格过高,而且2022年及以后配备的内存不足。
用户想从RTX 40系列中得到的,也是英伟达应该提供的,是每层都有一个64位的更宽的接口,每层都有4GB的内存——除了RTX 4090,也许还有一个8GB的RTX 4050。如果它们是带有192位总线的12GB卡,用户对4060和4060 Ti的大多数抱怨都会消失。4070和4070 Ti也是如此:16GB和256位总线将使它们成为更好的GPU。RTX 4080和即将推出的RTX 4080 Super应该是320位20GB。更高的内存配置甚至可以在一定程度上证明价格上涨是合理的,但英伟达却提高了价格并削减了内存接口宽度。它提醒了我们这个列表中的下一个条目……
3 - GeForce RTX 2080和Turing
在推出GTX 10系列后,英伟达在游戏图形领域的影响力达到了顶峰。在整个产品堆栈中,AMD几乎无法与英伟达的超级高效GPU竞争,尤其是在笔记本电脑领域。当英伟达取得巨大的领先优势时,它通常会跟进推出新的GPU,这些GPU会在现有显卡的基础上进行真正的升级。在Turing架构发布之前,社区对Jensen Huang和他的团队所做的工作感到兴奋。
2018年夏天,英伟达终于公布了其20系列GPU——它们不是GTX 20系列,而是以RTX 20系列亮相,这个名字的改变意味着英伟达推出了世界上第一款实时光线追踪显卡。光线追踪在过去和现在都是一项令人难以置信的技术成就,被称为图形学的“圣杯”。这项技术已经应用到游戏GPU中,有望在保真度和真实感方面带来一场革命。
但后来人们开始阅读细则。让我们明确一点:与此列表中的任何其他GPU相比,这确实是RTX 20系列的全部产品受到指责的地方。
首先是价格问题:这些显卡非常昂贵(在很多方面比当前40系列的定价还要贵)。RTX 2080 Ti首发价1199美元?在此之前,使用单个显卡的顶级英伟达游戏显卡从未达到过四位数,除非你想算上Titan Xp。RTX 2080比即将推出的GTX 1080 Ti更贵。英伟达还比第三方版本早一个月发布了创始人版显卡,价格溢价为50至200美元——在某些情况下,这种溢价并没有真正消失。
此外,光线追踪确实很酷,但当RTX 20系列发布时,几乎没有游戏支持它。并不是所有游戏开发者都可以突然从传统方法转向光线追踪,从而忽略95%的游戏硬件市场。这些GPU真的值得购买吗,或者人们应该完全跳过20系列?
RTX 2080 Ti由于是一个巨大的GPU,比GTX 1080 Ti快得多。然而,RTX 2080只能与1080 Ti相提并论,它们名义上是相同的价格。而且,2080的内存少了3GB。RTX 2070和RTX 2060表现稍好一些,但它们没有像之前的GTX 1070和GTX 1060那样提供令人难以置信的改进,并且再次将代定价提高了100美元。2018年提供光线追踪的游戏《战地5》即使在RTX 2080 Ti上运行也非常糟糕:在我们的1080p测试中,它只能获得平均100 FPS。需要明确的是,2080 Ti被宣传为4K游戏GPU。
但是,建立光线追踪游戏的生态系统需要时间,而英伟达已经宣布了另外10款将支持光线追踪的游戏。其中一款游戏被取消了,剩下的9款游戏中有7款添加了光线追踪。然而,其中一款游戏只在Xbox Series X/S版本中添加了光线追踪功能,另外两款是亚洲的MMORPG。即使是英伟达的光线追踪宠儿原子之心(Atomic Heart)也在2023年初最终推出时跳过了光线追踪,距离最初的RT技术演示视频已经过去了五年。
当英伟达后来推出GTX 16系列时,整个RTX品牌也陷入了更加混乱的局面,从GTX 1660 Ti开始,使用相同的Turing架构,但没有光线追踪或张量核。如果RT是未来,每个人都应该加入这一潮流,那么英伟达为什么要退缩呢?我们只能想象英伟达在假设的GTX 1680 / 2020上能做些什么:更小的芯片尺寸,所有的光栅化性能,没有任何额外的东西。
为了给英伟达一些信任,它至少尝试通过推出2080、2070和2060的“超级”型号来解决20系的定价问题。这些都提供了更好的性价比(尽管2080 Super基本上毫无意义)。然而,这也表明最初的RTX 20系列GPU并不贵,因为生产成本——毕竟,它们使用相对便宜的GDDR6内存,并在台积电的12nm节点上制造,基本上是16nm, 亿配芯城 但能够为2080 Ti制造大芯片。AMD在2019年的RDNA / RX 5000系列中转向了台积电7nm。RTX 20系列之所以昂贵,可能只是因为英伟达相信它们会以这样的价格出售。
事后看来,RTX 20系列中真正的“圣杯”是深度学习超级采样(简称DLSS),它与今天的AI爆发相吻合。虽然DLSS的起步并不顺利——就像光线追踪一样,很多承诺都被打破了,质量也不是很好——但今天这项技术已经出现在500多款游戏中,效果非常好。英伟达应该更重视DLSS而不是光线追踪。即使在今天,只有37%的RTX 20系列用户支持光线追踪,而68%的用户使用DLSS。它应该是DTX而不是RTX。
2 - GeForce GTX 480:Fermi第一轮未能交付
虽然英伟达在2000年代末曾经是第一名,但在2009年,该公司的桂冠输给了最近被AMD收购的ATI。HD 5000系列是在英伟达自己的下一代GPU准备就绪之前推出的,HD 5870是自Radeon 9700 Pro以来第一款获胜的ATI旗舰产品。英伟达也不甘落后,它将在2010年初推出全新的显卡。
值得注意的是,此时英伟达和AMD/ATI在处理GPU方面有多么不同。英伟达专注于在较老的节点上制造大量的芯片,这既便宜又高产,而ATI则在HD 3000系列上转向更先进的工艺上使用更小的芯片,并将这种设计策略保持到HD 5000系列。英伟达即将推出的代号为Fermi的GPU将和上一代一样大,不过这一次英伟达将在工艺上与上一代相当,使用台积电的40nm工艺,就像HD 5000阵容一样。
2010年3月推出的旗舰产品GTX 480大获成功。在评测中,它轻松击败了HD 5870。高端的HD 5970仍然是最快的显卡,但它在CrossFire中使用了两个显卡,这并不总是一致的。但GTX 480售价499美元,远高于售价约400美元的HD 5870。英伟达的旗舰产品总是收取溢价,所以这次也没有太大不同……除了一件事:权力。
英伟达的旗舰产品从来都不是特别高效,但GTX 480却令人难以置信。它的功耗约为300瓦,与双GPU HD 5970相当。相比之下,HD 5870的功耗仅为200瓦,这意味着480的功耗高出50%,性能可能提高10%到20%。这要追溯到GTX 280之前的236瓦的纪录,对于旗舰来说仍然相对较高。
当然,功率会转化为热量,而GTX 480也是一个超级热的GPU。讽刺的是,参考冷却器看起来有点像一个烧烤架,480被嘲笑为“它应该被烧烤的方式”,讽刺英伟达的“它应该被玩的方式”游戏赞助,以及像在GTX 480上煮鸡蛋的表情包视频。对于英伟达的营销人员来说,这不是一个好时机。
最终,困扰GTX 400系列的问题被证明是困难的,以至于英伟达在半年后用重新设计的Fermi架构替换了GTX 500系列。新款GTX 580的功耗仍然在300瓦左右,但比480快了10%,而500系列的其他产品的效率总体上优于400系列。
英伟达在400系列上确实搞砸了——如果做得很好,不可能在半年内更换整个产品堆栈。AMD在整个显卡市场的份额非常接近于超越英伟达,这是自2000年代中期以来从未发生过的事情。尽管Fermi失败了,但英伟达赚的钱仍然比AMD多,所以至少它不是绝对的灾难。它还为重新关注效率铺平了道路,使下一代英伟达GPU的性能大大提高。
1 - GeForceFX 5800 Ultra
在1999年推出首款GeForce 256的GeForce品牌之后的几年里,英伟达取得了连胜。它的最后一个竞争对手是加拿大显卡公司ATI Technologies,尽管该公司仍有一些竞争,但英伟达连续几代都取得了胜利。然后ATI在2002年用Radeon 9700 Pro改变了游戏规则,由于其破纪录的芯片尺寸,GeForce 4系列被淘汰。
毫无疑问,英伟达会用它的大型GPU进行反击,这款GPU可能在9700 Pro之前就已经在开发了。然而,如果英伟达对制造大尺寸的芯片有任何疑问,ATI就会打消他们的疑虑。此外,考虑到ATI在Radeon 9000系列上的巨大领先优势,英伟达实际上没有太多选择。但随着英伟达转向130纳米节点,而9700 Pro则在150纳米节点上,英伟达无疑拥有巨大的技术优势。
2003年初,英伟达推出了GeForce FX 5800 Ultra,价格与9700 Pro相同,仅为399美元,具有竞争力。然而,5800 Ultra只是部分成功地夺回了领先地位,特别是在更高的分辨率下。这是因为5800 Ultra的内存带宽只有16GB/s,远低于9700 Pro的近20GB/s。
还有一个问题是各向异性滤波看起来不是很好,这进一步削弱了5800 Ultra应该拥有的性能领先优势。这是一个驱动程序的问题(那时驱动程序对视觉质量非常重要),尽管这意味着它是可以修复的,但它仍然是一个问题。
然后是电力消耗。尽管75瓦左右的功耗在今天看来很奇怪,但在当时,这确实是一个巨大的数字。相比之下,在我们的测试中,9700 Pro的功率仅为54瓦,因此它的效率比英伟达的新旗舰产品高出近50%。那噪音呢?“像吸尘器一样”,根据20年前的评论,其他人称之为吹叶机。
半年后,英伟达迅速推出了更新、改进的旗舰产品GeForce FX 5900 Ultra。这款新的GPU拥有27GB/s的带宽,固定的驱动程序,以及更合理的60瓦左右的功耗。英伟达确实将价格提高了100美元,但考虑到英伟达也提高了其在性能上的领先优势,这是很公平的,尽管与此同时,Radeon 9800 Pro已经上市。
值得注意的是,GTX 400系列并不是第一款以微弱优势从ATI手中夺回性能领先优势的英伟达GPU,同时还存在功耗问题,并在半年后被替换。但GeForce FX 5800 Ultra之所以排在第一(还是最后)的位置,是因为它在一个更先进的过程中,但仍然与9700 Pro有很大的差距。对于英伟达的工程师们来说,那一定是一个非常丢脸的时刻。
不光彩之举:专利技术废话
英伟达不仅仅是一家硬件公司,它也有软件。而英伟达似乎最喜欢做的是让它的硬件+软件生态系统变得封闭。该公司已经推出了大量只适用于英伟达硬件的功能,有时只适用于特定类型的英伟达硬件。如果这还不够糟糕的话,这些功能的寿命也往往与谷歌的许多产品和项目相当。
我们知道有时候一家公司想要用新技术推动市场前进,但这些技术应该是游戏开发者和图像专业人士想要的,而不仅仅是任意的供应商锁定的解决方案——DXR就是这种方法的一个很好的例子。几乎下面每一项都可以作为开放标准来完成;英伟达只是利用其市场份额试图避免走这条路。
SLI: SLI是一种允许两个(或更多)GPU渲染游戏的技术,最初由破产的3dfx推出,随后被英伟达收购。理论上,这意味着性能翻倍,但它依赖于良好的驱动程序支持,容易出现帧卡顿和视觉故障,并且消耗大量功率。多年来,它一直是英伟达主流GPU的主要产品,但在2020年,RTX 30系列实际上已经停产。RIP SLI和转移注意力的方法承诺提高多个GPU的性能。
PhysX: PhysX是为游戏制作的物理软件,最终落入Ageia手中。该公司创建了物理处理单元(或PPU)卡来加速PhysX的使用,而PhysX通常在CPU上运行。英伟达在2008年收购了Ageia,并直接将PhysX支持添加到其GeForce GPU中,英伟达大力说服用户购买额外的显卡来加速PhysX。
然而,很多人并不喜欢GPU加速的物理,包括传奇游戏开发者John Carmack,他认为物理应该属于CPU。他的观点最终被证明是正确的,因为PhysX最终面向CPU开放,然后成为开源,但自《蝙蝠侠:疯人院》以来,它就没有真正用于GPU。PhysX,至少作为一项专利技术,已经过时了,这是一个很好的摆脱。
3D视觉:2009年首次亮相,3D视觉试图利用2000年代和2010年代的3D视觉热潮。它有两个部分:在DirectX游戏中实现立体视觉的驱动程序,以及可以产生3D效果的眼镜。尽管我们认为3D视觉可能是“游戏的未来”,但事实证明人们并不喜欢3D,对3D的热情在2010年代早期到中期逐渐消退。3D Vision一直举步维艰,直到2019年才被砍掉。
G-Sync: G-Sync于2013年首次问世,是一款安装在游戏显示器上的硬件,可以动态改变刷新率以匹配帧率,从而防止屏幕撕裂。虽然这是V-Sync的一个更好的解决方案,但G-Sync显示器非常昂贵,而且该功能不能与AMD GPU一起使用。
与此同时,Vesa的Adaptive Sync和AMD的FreeSync(基于自适应同步)做了同样的事情,而且没有额外的成本,这使得G-Sync对英伟达用户来说客观上是一个更糟糕的解决方案。2019年,英伟达终于允许其用户使用自适应同步和FreeSync显示器,并为基于自适应同步的显示器推出了G-Sync兼容品牌,这些显示器可以在英伟达和AMD卡上运行。现在仍然有专有的G-Sync显示器,但它们几乎都是高端型号,似乎代表着一个即将消亡的品种。
VXAO:基本上是一个高端版本的环境遮挡,可以创建更逼真的阴影。然而,VXAO非常依赖GPU,只参与了两款游戏,2016年的《古墓丽影:崛起》和2018年的《最终幻想15》。实时光线追踪技术的出现让VXAO变得多余,尽管它基本上一问世就被废弃了。
DLSS:深度学习超级采样是RTX GPU的首要功能之一,尽管它非常出色并且运行良好,但它仍然是专有的。它不能在AMD的GPU上运行,也不能在英伟达的非RTX卡上运行。这意味着即使是在RTX 20系列中使用Turing架构的GTX 16系列也不支持DLSS。DLSS 3帧生成也仅限于RTX 40系列卡和更高版本。如果英伟达能像英特尔那样对待XeSS,并提供两个版本:一个用于使用Tensor内核的RTX GPU,另一个用于其他所有模式,那就太好了。
审核编辑:刘清