全新NVIDIA RTX 5090D问世,性能再攀高峰,DLSS 4.0引领未来!
一、前言:主要规格几乎一刀未砍的RTX 5090D
2025年1月23号,也就是今天,NVIDIARTX5090正式解禁!不过该显卡在内地市场无法购买到,我们收到的是RTX5090D版本,这也使得我们的首发评测相比国外同行迟了一天!
尽管RTX5090D在各方面都对RTX4090D进行了全面的性能削减,但RTX5090D只是将AI算力从3352TOPS降低到2375TOPS,其他规格没有任何变化。这意味着它的游戏性能几乎与RTX5090相同。从中可以看出NVIDIA对内地游戏市场的重视程度。
AD102核心
GB202核心
RTX5090采用GB202核心,可以看出它与前一代的AD102非常相似,两者都拥有12组GPC,每组GPC包含16个ROP,这意味着GB202与AD102的最大ROP单元数量相同,均为192个。
AD102的每组GPC包含6组TPC、12组SM单元、1536个流处理器。而GB202则在每组GPC中增加了2组TPC,使得每组GPC包含8组TPC、16组SM单元、2048个流处理器,增幅达到了三分之一。 这种设计上的改进表明了技术的进步,使GPU在处理能力和效率上有了显著提升。从数字上看,GB202在各个层面都比AD102有所增强,特别是在流处理器数量上的大幅增加,这无疑会带来更强大的计算性能和更高的工作效率。对于依赖高性能计算的应用领域来说,GB202的推出无疑是一个令人振奋的消息。
完整的GB202核心包含24576个CUDA核心(分为12组GPC、96组TPC、192组SM)、768个第五代TensorCore张量核心、192个第四代RTCore光追核心、768个纹理单元、192个ROP单元以及128MB二级缓存。这样的配置无疑让这款GPU在处理复杂的图形运算和深度学习任务时更加游刃有余,特别是针对光线追踪技术的支持,使得游戏和专业应用中的图像质量和性能得到了显著提升。此外,大量的CUDA核心和强大的张量核心也让它在高性能计算领域具有极大的潜力,未来可能在科研和工程计算方面展现出更大的价值。
RTX5090在原有基础上进行了一些优化,配备11组GPC共计21760个流处理器、680个TensorCore、170个RTCore以及192个ROP单元,并且完整保留了128MB二级缓存。
关于RTX5090D,推测可能是屏蔽了1/3的Tensor Core张量核心,其余参数保持不变。
RTX 5090D参数规格如下:
当然,仅仅是规格提升三分之一并不足以全面展示Blackwell架构的优势。该架构引入了多帧生成(MFG)技术和DLSS 4,这得益于其强大的28Gbps GDDR7显存以及512位显存位宽的支持。这些创新不仅提升了图像处理能力,还增强了对复杂Transformer模型的支持。 从目前来看,Blackwell架构的这些改进确实为高性能计算和图形渲染领域提供了新的动力。特别是多帧生成技术的应用,有望在游戏和专业软件中实现更流畅的体验。不过,新技术的普及往往伴随着一系列挑战,包括软件优化、成本控制以及生态系统建设等。未来能否充分发挥这些新特性的潜力,还有待观察。
时间所限,对于Blackwell架构这里暂不多做介绍,感兴趣的读者可以参考这篇文章《Blackwell RTX50架构深度揭秘:AI神经网络渲染、DLSS4才是战未来!》。 在当今快速发展的科技领域,Blackwell架构的引入无疑为未来的图形处理技术开辟了新的道路。它不仅在性能上实现了显著提升,而且在人工智能神经网络渲染方面也展现了巨大的潜力。尤其是DLSS 4技术的应用,更是让人们对未来的图像处理能力充满期待。这一进步不仅仅是技术上的突破,更是对未来游戏和图形密集型应用体验的一次重大革新。随着这些新技术的发展,我们有理由相信,未来的视觉体验将会达到前所未有的高度。
七彩虹iGame RTX 5090D Advanced 32G GPU截图
由于RTX 5090D没有公版,此次首发测试我们使用的是七彩虹iGame RTX 5090D Advanced 32GB。
这款显卡具备一键超频功能,在出厂预设状态下,其参数与NVIDIA官方规格一致:575WTDP热设计功耗、2407MHz动态加速频率、28Gbps显存速度。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.016685秒