
发布日期:2025-04-15 21:36 点击次数:116
开始的地方在线配资炒股选
如今越来越多的游戏都将支持光线追踪作为基本的卖点,而支持光线追踪的其实早在RTX 20系时就发布了。作为第一代光追显卡,当时的性能表现确实是有些捉襟见肘,一度不少玩家直呼“光追根本没必要”。不过随着RTX 30系、RTX 40系乃至最新的RTX 50系显卡发布后,显卡性能可以说是有了质的飞跃,迎战光追可以说是轻轻松松。
当然,显卡的代际提升带来的不仅仅是游戏性能的增幅,在光追层面NVIDIA也有了长足的进步,特别是从最开始的光线追踪,到后来的全景光线追踪,再到现在引入神经网络渲染,每一次的升级都带来了光追画面的极致体验。就在前段时间,NVIDIA带来了《半条命2》RTX版,这款游戏早在2004年就已经发售了,一发售就横扫各大奖项,成为一代传奇。
《半条命2》RTX实机演示
全新的《半条命2》RTX版与旧版还是有明显的不同的,新版借助NVIDIA RTX Remix技术,让这款经典游戏也支持了光线追踪技术,同时还对游戏资源进行全面高清化处理,并且还支持RTX 50系显卡独有的DLSS 4以及NVIDIA Reflex等技术,在细节表现上更加出色。
展开剩余96%在开始实机展示前,还是应该给各位玩家科普一下上面提到的NVIDIA RTX Remix技术,它是NVIDIA推出的游戏模组工具,它可以利用现代光线追踪和 AI 技术,让经典游戏在现代技术的加持下焕发出新的光彩,可以说RTX Remix 不仅是一项技术突破,更像是一座桥梁,连接了过去的游戏与未来的创新。
游戏开发者在重制经典游戏时,游戏内的纹理、模型、光照、效果等都可以被捕捉、分类并重新组装成可编辑的场景。利用RTX Remix工具即可快速将更新的游戏资产替换过去的旧的游戏资产,同时还可以将灯光转换为完全光线追踪,并利用AI增强纹理以及添加DLSS超分技术用于提升游戏运行体验等。
不过说到RTX Remin就不得不提最新的RTX 50系显卡了,其引入了神经网络着色器的概念,利用这一概念,RTX Remix还可以凭借RTX神经网络辐射缓存,进一步改善间接光照和性能,带来更逼真的画质与更流畅的游戏体验。
全景光线追踪(Full Ray Tracing)
下面给大家看看《半条命2》RTX版本究竟带来了哪些变化,首先最明显的一点就是其引入了高质量的实时光线追踪效果,并且采用了完整的路径追踪技术。全景光追可以说是显卡杀手级别的技术了,它可以将阴影、反射、全局照明、折射等所有光照效果统一纳入单一的光线追踪算法中,确保每束光线都被精确追踪。
因此,当你玩过经典版本的《半条命2》,再玩一次《半条命2》RTX版,你会发现整个画面都不一样了,过去破旧不堪的世界,现在焕然一新,仿佛换了一款游戏一样。逼真的光照、阴影和反射效果,极大地提升了游戏的沉浸感。
透过全景光线追踪技术,灯光照射在人物也好,还是地面也好,都会有逼真的阴影效果或反光效果,非常符合现实环境。丰富的细节能够呈现出无与伦比的深度和真实感,为玩家带来更加震撼的视觉体验。
RTX神经辐射缓存
说完了全景光线追踪技术,下面就该聊聊RTX 50系显卡带来的独门秘笈——RTX神经网络渲染,NVIDIA在RTX 50系中进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。
其中《半条命2》RTX版中已经有RTX神经网络辐射缓存的相关设置,RTX神经辐射缓存能够显著提升了光线追踪间接照明和反射光照的质量,同时大幅提高了整体游戏性能。
RTX神经网络辐射缓存能够依托玩家实时的游戏数据,通过AI神经网络进行自我训练,从而计算出场景的间接光照。这样得出的间接光照结果不仅更准确,响应速度也更快。根据NVIDIA官方的数据,在《半条命2》RTX版中开启RTX神经网络辐射缓存后,能使运行速度提升高达15%。
不仅如此,启用RTX神经网络辐射缓存以后,还能够带来更多的细节呈现。例如上图中的地板,在开启该功能后,很明显可以看到地板的图像更加清晰,同时地面的纹理也能够很好的得到保留。
NVIDIA RTX Volumetrics
RTX Volumetrics技术则是一项体积算法技术,它采用ReSTIR算法来计算体积,并精确追踪光线在空气、雾、烟雾及大气中的散射情况。传统的光栅化体积效果需要为场景中的每个光源创建多个性能密集型的高质量阴影贴图,以防止明显的走样、闪烁和伪影。完整的光线追踪消除了对光栅化技术(如阴影贴图)的依赖,从而实现了无论场景中光源数量多少都可以高质量的实现。
例如上图中窗口人物在大雾中开启手电筒照射,光线经过雾气的时候会有一道明显的路径,并且光线在雾气中会出现折射现象,现场的光线场景复杂。在没有NVIDIA RTX Volumetrics加持时,雾气中的光线几乎没有区别,而有NVIDIA RTX Volumetrics加持下,不同的光影变得更加立体。
NVIDIA RTX Skin & Subsurface Scattering
在人物细节表现上,新一代光追技术也有黑科技——RTX皮肤&次表面散射功能,根据NVIDIA介绍,次表面散射功能可以应用于蜡烛蜡、大理石和翡翠等厚实、半不透明的材料,它可以模拟光线穿透皮肤或一些半透明材质时的散射效果,见过翡翠的玩家应该都知道,光线在穿透这些半透明材质时还会产生一定的微弱光线,能够进一步折射或者散射光线到其他地方,从而让材质更加透亮,提升整体的逼真程度。
反映在《半条命2》RTX版中就是光线照射到人体皮肤时,能够逼真地再现了真实皮肤的柔软、半透明质感;另一个画面是光线穿过猎头蟹时,微弱的光芒会将整个猎头蟹的皮肤照亮,在视觉效果上对比经典版本显得更加自然,而没有这项技术时,无论是猎头蟹还是人体皮肤都显得干巴巴,不够立体的感觉,观感不佳。
增强材质组件
当然,《半条命2》RTX版中除了有逼真的全景光追技术、优秀的神经网络渲染能力外,还引入了一项黑科技——增强材质组件。从名字就能看出来,这个功能能够显著提升游戏画质,在游戏的设置界面可以看到,这项功能可以实现材质的增强、网格着色的增强以及光线的增强。应用该功能,可以在游戏中实现近乎于现实生活的材质与光照体验,极大的增强游戏沉浸感。
例如可以看下面两个场景,在开启材质增强功能后,整个画面的细节变得异常丰富,无论是第一个场景中的绿叶,还是第二个场景中的草地,在材质增强功能的加持下,变得更加立体,细节更加丰富,同时他们还可以与周围的光线进行交互,对视觉效果的提升非常大,基本可以说对游戏画质是一个质的飞跃,甚至说换了一个游戏玩也不为过。
硬件介绍
看完了上面出彩的画质,想必你也迫不及待想要体验一下最新的《半条命2》RTX版了吧,不过想要感受这般顶级的游戏体验,你还缺一张RTX 50系显卡。要问哪款最合适,那必是技嘉GeForce RTX 5080 XTREME WATERFORCE 16G,既有旗舰级的性能释放,又有水冷散热加持,随时能够保持冷静。
这款显卡的包装盒相当吸睛,正面是经典的雕型Logo,不过其用上了金属加机械的风格设计,既彰显了这款显卡为电竞而生,同时也表明了它隶属于大名鼎鼎的水雕系列。包装盒左下角印的则是这款显卡的相关配置,例如配备了技嘉引以为傲的水之力散热系统,显卡还搭载了16GB的GDDR7显存,同时技嘉显卡还能享受领先业内的超长4年质保服务。
包装盒的背面就比较简单了,主要为显卡内部用料的详细介绍。比如这款显卡搭载的水之力散热系统,主动散热设计+被动散热模组为GPU、显存和MOSFET等关键元器件提供高效的散热解决方案,以确保系统在高频下的稳定性。
再来看看技嘉GeForce RTX 5080 XTREME WATERFORCE 16G本体,整张显卡可以分为两部分,分别是显卡本体以及360水冷散热器。
技嘉 GeForce RTX 5080 XTREME WATERFORCE 16G 的外观设计堪称艺术品。显卡整体采用了黑色为主色调,搭配金边视觉分层设计,展现出一种冷峻而高贵的气质。右侧的透明件上刻有AORUS 的标志,给人一种强烈的科技感,斜切的纹理则加强了显卡的层次感。
值得一提的是,显卡的正面与边缘藏有LOGO灯以及灯光线条,利用亚克力的导光特性,正面AORUS LOGO能够展现光与影交错的层次变化,打造出极具科技感的奢华视觉效果。
显卡背面的设计与正面颇有异曲同工之妙,采用了一体成型的金属背板设计,做工考究,质感十足。整体还是以黑色作为基底,但引入了拼接的灵感,让整张显卡的颜值跃升一步,妥妥的工艺美学设计品。
背面中央这是显卡的大脑——GB203-400-A1核心,拥有10752组CUDA核心,稍多于前代的RTX 4080 SUPER,通用的图形性能自然更强。而在工艺制程方面,新的GB203核心沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为378mm2,内部晶体管数量则有456亿,在这么小的空间内堆下如此之多的晶体管,可以说是绝对工业艺术品的集大成之作了!
视线转移至显卡的顶部,这里也沿用了拼接的设计风格,左侧是NVIDIA显卡经典的GEFORCE RTX字样,右侧则是镂空的AORUS LOGO标识,并且下面还藏有RGB灯条,当显卡通电时,能够亮起RGB灯效,进一步提升显卡辨识度。
顶部还有显卡的供电接口,被安排在显卡顶部最靠右的位置,目的是装机时尽量不让电源线挡住这款显卡的颜值,接口为12V-2×6接口,单口可提供600W供电能力。
底部则是显卡的金手指,这一代显卡的PCIe接口升级成为了5.0速率,这也是首次在RTX 50系显卡上应用,能够带来更高的传输速率,另外仔细看金手指的形状,它和上一代的显卡也有些微的变化。
视频输出接口部分,还是经典的3个DP加1个HDMI的配置,不过规格上有了升级,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G采用的是DP 2.1b与HDMI 2.1b规格,理论上,这一代显卡的视频输出接口可以轻松实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需求。
再来看技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的另一部分,其配备了巨大的360水冷,官方称之为水之力散热系统。其内部分为主动散热以及被动散热两部分,出色的散热效能为这款显卡带来了极致的性能释放潜力与绝佳的噪音控制能力。
让我们先看主动散热的设计,风扇部分,冷排上安装了3个配备双滚珠轴承的120mm ARGB风扇,不但高效低噪,还拥有出色的使用寿命,喜欢RGB的玩家还可以通过技嘉控制中心(GCC)来自定义灯效实现整套主机的灯效同步。
冷排部分,显卡使用了优化设计的360mm铝质冷排,通过巨大的散热体积提供了极高的热容,从而让风扇在低转速下也能保证足够的散热效果,有效降低了显卡满载工作的风扇噪声。
而被动散热部分则仰赖于内部的全铜底板散热设计,铜质底板直接与GPU与显存接触,同时冷头的水路还延伸到了MOSFET区域,能够进一步提升整卡的散热效果。
除此之外,显卡内部还配备了高端的液态金属复合硅脂,配合服务器级导热凝胶,让整个水之力的散热系统能够实现吸热最大化,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G时刻都能冷静输出。
技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的冷头端与360mm冷排端则是用编织网的铁氟龙管进行连接,不仅可以有效提高水管抗物理损坏的能力,同时还增加了显卡整体的颜值。
总的来说,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G绝对称得上旗舰中的旗舰,不仅搭载了高端的GB203核心,在用料和规格上都远超其他RTX 5080,搭配一体式水冷散热设计,可以让玩家进一步挖掘RTX 5080显卡的性能潜力,获得更加极致的游戏体验,完全就是发烧级玩家装机的首选装备。
实际游戏性能
下面是游戏性能实测部分,测试前介绍一下本次的测试平台, 使用的是目前毫无争议的游戏神U—— Ryzen R7-9800X3D,则是来自技嘉的X870 AORUS ELITE WIFI 7主板,,刷新到最新版本BIOS的同时,在BIOS中开启X3D模式,以便获得更好的性能表现。
为G.Skill的幻锋戟Z5 RGB DDR5,在这块主板上能轻松达成DDR5-8000 C38的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。完整测试平台如下所示:
再来看看游戏内部的设置,其标配了最新的DLSS 4技术,这也就意味着玩家换装最新的技嘉RTX 50系显卡能够获得更极致的游戏帧数体验。测试过程中我们会将各种画质、材质技术都开至最高档位。
首先看2K分辨率的表现,原生分辨率下,无论是技嘉GeForce RTX 5080 XTREME WATERFORCE 16G还是前代RTX 4080都能流畅运行,不过整体性能表现上,前者更好一些,比RTX 4080强约13%。二者在开启DLSS 3以后,游戏体验都有了进一步的提升,其中技嘉GeForce RTX 5080 XTREME WATERFORCE 16G能够做到186 FPS,已经能够满足2K@160Hz的高刷游戏需求,如果你接着打开DLSS 4,你会发现RTX 50系显卡的魅力之处,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的帧数进一步暴涨至302 FPS,对比原生分辨率,提升了4-5倍之多,这已经不能用高刷来形容了!
在特效和增强全开的情况下,4K分辨率对技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的压力可不小,在不开启任何超分技术的情况下,游戏帧数仅有37 FPS,基本不能正常游戏。而上一代RTX 4080则更是只剩28 FPS,也是卡成PPT。仅开启DLSS 3后,游戏帧数就有了好转,两款显卡都能丝滑流畅的游玩了,不过技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的性能表现还是比RTX 4080高约12%。4K分辨率解锁DLSS 4后,游戏帧数则相比原生分辨率提升了6-7倍以上,同时对比DLSS 3,DLSS 4仰仗多帧生成的强悍性能,在游戏帧率表现上也领先前者近100%。
DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,基本上可以说DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。
另外,游戏设置中还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。这里我们也截图了相同的场景进行对比,从下图可以看出Transformer模型能够带来更多的细节。例如左侧图片中的墙壁,这部分表现是比较清晰的,细节也更多,而CNN模型中则几乎不可见。图片中主体的木屋纹理也是Transformer模型下会更清晰,线条更锐利。
总结
通过简单的测试,我们可以清晰地看到RTX Remix技术和全景光线追踪技术为《半条命2》RTX版带来的巨大性能提升和卓越游戏表现。游戏的沉浸感与画面效果指数级上升,各种黑科技的加持下让一款经典游戏《半条命2》焕发了第二春。
不过大家看上面的测试也知道了,毕竟是最顶级的光追表现,其对GPU算力的开销相当大,如果玩家要体验“全景光线追踪”,硬件性能不可少,这时候你就需要一张GeForce RTX 50系列显卡,凭借其出色的光线追踪性能和DLSS 4技术,就能让游戏在现代3A大作的画质下以更高的帧率流畅运行。
技嘉GeForce RTX 5080 XTREME WATERFORCE 16G作为旗舰级的存在,自然是极客玩家的最佳选择,不论是从外观设计、硬件堆料、散热效能还是做工水准来说,都全方位展示了技嘉的实力。技术层面,全新的Blackwell架构、DLSS 4、RTX神经网络渲染等技术将它推向了新的高度。
性能上更是不遑多让,就拿实测的《半条命2》RTX版来说,在最高画质预设下,凭借DLSS 4技术,能够做到原生画质的6-7倍提升,可以说是非常夸张了,随着支持DLSS 4的游戏越来越多,届时RTX 5080的性能又将迎来一次飞跃。如果你还在纠结选配什么装备好,不妨考虑下本次测试的技嘉GeForce RTX 5080 XTREME WATERFORCE 16G显卡,无论是对于追求极致游戏体验的玩家,还是对于需要强大图形处理能力的创作者来说,它都是一个非常值得考虑的选择!
NVIDIA光线追踪技术发展
最后再给大家聊点硬核的,也算是给大家科普一下光线追踪技术。光线追踪对大部分玩家来说,是一项既熟悉又陌生的技术。说熟悉,是因为可能大家其实都见过;说陌生,是因为除了计算机图形领域的专家,真正了解该技术的人可能为数不多。
什么是光线追踪?
光线追踪这一技术本身并没有多少的新鲜花样,光线追踪说白了就是一种在2D屏幕上呈现3D图像的方法,如果你想了解光线追踪,你可以环顾四周,找到被光线照亮的物体,沿着到达视点的光线反方向进行追踪,就是光线追踪。
其实光线追踪在很久之前就已经出现了,但是一般都被应用于动画电影中,直到现在才在游戏中广泛应用。究其原因还是计算量过于庞大,以之前的硬件水平难以胜任这项重活,即使能够完成光追实时渲染,但所需时间也是不可估量的。因此在游戏实现光线追踪之前,绝大多数游戏厂商都以来另一项技术来处理光线的问题,即光栅化。
什么是光栅化?
按照字面意思就是把图像栅格化、像素化,将电脑生成的矢量转换成屏幕像素点的过程。比方说,游戏中物体建模的时候都是三维,由点线面构成,但要显示在二维的显示器上,就需要一个“降维打击”——光栅化,成为能够被显示的像素点,其实就是三维向二维的转化过程。
目前大部分游戏还是使用光栅化技术,因为光栅化需要的计算量不大,所以在实时渲染上光栅化技术仍然是大部分游戏的高效方案。而光栅化最大的问题就是需要提前预设大量的渲染效果,比如游戏场景中的光影、反射等效果都是要提前预置好,然后进行“贴图”,这也是为什么你在玩游戏时光影效果明明看起来很真实,但是还是有虚拟的感觉。
如何实现光线追踪?
老黄之前在接受媒体访问时曾说过“RTX是一场豪赌,是非常非常冒险的,但它有两项伟大的发明。一是硬件加速光线追踪,也就是模拟光线。” 甚至一度认为10年、20年甚至30年都无法实现实时的光线追踪,不过好在最后这项艰巨的任务完成了。
那计算量极大的光追NVIDIA又是怎么实现的?这里就要提到NVIDIA突破性的技术了,在2018年时,NVIDIA就宣布了可加速硬件中光线追踪速度的新架构Turing(图灵架构),以及第一款搭载实时光线追踪技术的RTX 20系列显卡。
在Turing架构中,每一个SM单元里都拥有一个RT Core,其是专门为光线追踪技术服务的。而要了解RT Core的工作原理,我们首先要了解光线追踪所运用到的算法:BVH,全称Bounding volume hierarchy
其中BVH算法就是一种用来管理3D场景中物体的方法。比如渲染对象是一只兔子,要计算一条光线和兔子本身的交互,就把兔子所在空间划分成N个包围盒,如果光线没有碰到兔子所在的包围盒,表明该直线一定不会和兔子相交,如果该光线碰到兔子的包围盒,再把这个包围盒继续划分成N个更小的包围盒,再次计算光线是否与兔子所在的包围盒相交,如此反复,一直找到和光线相交的三角形所在的包围盒,再对这个三角形进行最终的渲染。
而在光线追踪里,很多相邻的光线通常会有相同的光路,讲人话就是经过一样的包围盒,因此计算就是相同的,采用BVH算法可以大大减少计算每一条光线最近相交点所需要遍历的三角形数量,而且只需要进行一次就能给大部分光线使用,大大提高了执行效率。因此显卡也能胜任这项工作,玩家也能玩上画质更精美更真实的游戏了。
RT Core工作原理
而RT Core的工作原理就是,着色器发出光线追踪的请求后,交给RT Core就开始“接单”处理了,由于上面我们讲到BVH算法检测到光线与物体相交会有一个三角形,因此RT Core会进行两种测试,分别为边界交叉测试Box Intersection Evaluators和三角形交叉测试Triangle Intersection Evaluators。基于BVH算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果。最后RT Core还要配合GameWorks SDK的光线追踪降噪模块、RTX API等软件层面的协同工作,才能实现实时光线追踪。
第一代RT Core
其中第一代RT Core就是Turing架构显卡上首次引入的开创了实时光线追踪的先河,实装在了当时的RTX 20系显卡之上。第一代RT Core可提供34T的RT性能,而Tensor Core可提供DLSS处理能力,能提供89T的性能。
第二代RT Core
而第二代RT Core则是出现在Ampere架构的RTX 30系显卡之上,在Ampere架构中,单元的性能都获得了大幅度提升,RT Core的RT性能提升至58T,幅度是1.7倍;Tensor Core的Tensor性能提升至238T,幅度2.67倍。
而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)进行加速。所以老黄在第二代RT Core里增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。
并且第二代RT Core可以让光线追踪与着色同时进行,进行的光线追踪越多,加速就越快。它将光线相交的处理性能提升了一倍,在渲染有动态模糊的影像时,按照NVIDIA自己的实测,比Turing快8倍。
第三代RT Core
RTX 40系显卡则引入了革命性的Ada Lovelace架构,其最大的提升还是在第三代 RT Core与第四代 Tensor Core身上。其中第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。
在Ampere架构中,第二代RT Core支持边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersection testing),用于加速BVH遍历和执行射线三角交叉测试计算,虽然光线追踪处理能力已经比初代的Turing架构核心更高效,但是随着环境和物体的几何复杂性持续增加,传统的处理方式很难再以更高效率及正确反应出的现实世界中的光线,尤其是光的运动准确性。
所以在第三代 RT Cores增加了两个重要硬件单元:Opacity Micromap Engine与Displaced Micro-Meshes Engine引擎。Opacity Micromap Engine,主要是用于alpha通道的加速,可以将 alpha 测试几何体的光线追踪速度提高2倍。
在传统光栅渲染中,开发人员使用一些 Alpha 通道的素材来实现更高效的画面渲染,例如 Alpha 通道的叶子或火焰等复杂形状的物体。但在光线追踪时代,这传统的做法会为光线追踪带为不少无效的计算,例如运动性的光线多次通过一块叶子,光线每击中一次叶子,都会调用一次着色器来确定如何处理相交,这时就会做成严重的执行成本与时间等待成本。
而Opacity Micromap Engine用于直接解析具有非不透明度光线交集的不透明度状态三角形。根据Alpha 通道的不透明,透明与未知等三个不同的块状态进行处理:透明则直接忽略继续找下一个,不透明块则记录并告之命中,而未知的则交给着色器来确定如何处理,这样GPU很大部分都不需要进行着色器的调试处理,能够实现更为高效的性能。
如果说Opacity Micromap Engine加速的是面处理,那么Displaced Micro-Meshes Engine就是几何曲面细节的加速器。如上图所示,在Ada Lovelace架构中,通过1个基底三角形+位移地图,就可以创建出一个高度详细的几何网格,所需要资源占用比二代RT Cores更低,效率也更高。
通过NVIDIA给出的创建14:1珊瑚蟹例子来说事,这里我们需要1.7万个微网格、160万个微三角形,在Ada Lovelace架构中BVH创建速度可加快7.6倍,存储空间缩小8.1倍。Displaced Micro-Meshes Engine起到了关键性的作用,其将一个几何物体根据不同细节分成密度不一的微网络处理,红色密度超高,细节处理越为复杂 。相应的低密度微网络区域则可以释放更多的资源与存储空间,这样Displaced Micro-Meshes Engine就可以帮助BVH加速过程,减少构建时间和存储成本。
同时Ada Lovelace架构SM中新增了着色器执行重排序(Shader Execution Reordering,SER),这是由于光线追踪不再只有强光或者阴影渲染处理,未来将会更多的是在光线的运动性,这样光线就会变得越来越复杂,着色器执行重排序(SER)的加入就是为了能够即时重新安排着色器负载来提高执行效率,为光线追踪提供2倍的加速,也能更好地利用GPU资源。
第四代RT Core
最最瞩目的还要属RTX 50系,这一代显卡换装了服务器级别的Blackwell架构,同时RT Core也更新至了第四代。相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。
综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。
第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。
该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。
另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将内存占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。
发布于:广东省Powered by 低息配资查询_股票配资资讯_线上配资门户 @2013-2022 RSS地图 HTML地图