《基于 RTX Server 的 GPU 光照烘焙系统.pdf》由会员分享,可在线阅读,更多相关《基于 RTX Server 的 GPU 光照烘焙系统.pdf(32页珍藏版)》请在三个皮匠报告上搜索。
1、基于RTXServer的GPU光照烘焙系统Wei NanTech LeadTencent Games#page#光照烘焙高品质游戏制作重要一环#page#核心目标口提升烘焙效率口提升烘焙质量口灵活多样的功能支持#page#烘焙计算量大、耗时长:口1km1km场景,CPU服务器,耗时2小时口5km5km场景,CPU服务器,耗时40小时#page#Build on NVIDIA Optix提供最大的灵活性1 GPUmulti-GPU,multi-node#page#RTX Serverwith 8 Quadro RTX 6000提供强大的计算资源#page#整体框架ClientRemote Con
2、nectLocal ConnectRemote ConnectWindowsLinux Baking ServerLinux Baking ServerBaking AppContainerizedLinuxContainerized LinuxBaking AppBaking AppContainerized LinuContainerized LinuxBakingAppBakingAppContainerized LinuxContainerized LinuxBakingAppBakiingApp#page#获得最佳效果和性能口优化算法口优化Workload口 Optix AI-Den
3、oiser#page#烘焙算法优化f(x(F)=pdf()1低差异随机采样序列重要性采样#page#烘焙算法优化1/41/,5/7/1/Base=21/32/1/4/7/,2/5/,/1/27Base=3伪随机数二维点集低差异序列点集(/2/30/2/30/(/(/2/00/a0/1/)(Basex=2Basey=3#page#烘焙算法优化口根据收敛判断,进行路径选代次数自适应口根据贡献度判断,优化路径弹射次数128spp直接光照采样方差较小,后续spp贡献度小,快速收敛#page#优化Workload:口 Pack Lightmap intoBig Atlas口实现直接光提升9倍,Batch
4、前间接光提升1.7倍Batch后#page#优化Workload口 Pack Volumetric Lightmap口实现8-9倍效率提升ctLightProbeCPULhCateCost0sBatch前518154Launch Category FIndirectlightProbePackedGPuLadmstages:3,Stages Duration:358.822S,Category Duration:350.8245Stage:Applyariablecost0.4S.DurationMax:e.018,Min:e.0o0,Avg:0.801Min:e.0AVB:0.61,MumT
5、inyMarps:432Marps Max:0.6GetBufferDatacost32.05.DurationMin:0.00AvE:0.074,WarpsMax:0.0Min:e.0AV2:0.6MumTinyMarps:432stage:ctLightPrtBatch后#page#优化Workload口 Signed Distance Field ShadowMapDistanceFieldHigh-Res VisibilityHigh-Res优化前DistanceField(Ray-Tracing)DownSamplingGPUHigh-ResBoundaryLow-Res Visib
6、ilityBoundaryDistanceFieldBoundary Visibility优化后(Ray-Tracking)UpsamplingScattering(Ray-Tracing)GPUGPUCPU#page#OptixAI-Denoiser效果Without DenoiserWith Denoiser#page#Optix AI-Denoiser口针对Pack的Lightmap,需要特殊处理通过指定区域进行Denoise通过UnpackRegion进行Denoise口对比其他AI-Denoiser,性能