上传者: 42105169
|
上传时间: 2025-09-17 12:16:00
|
文件大小: 41.45MB
|
文件类型: ZIP
基于计算着色器的点云渲染
该存储库包含我们的技术报告的源代码: MarkusSchütz,Bernhard Kerbl,Michael Wimmer。 (未经同行评审,目前正在提交中)
计算着色器可以比GL_POINTS更快地渲染点云。
结合了warp范围的重复数据删除和early-z,计算着色器能够在RTX 3090上的各种不同视点以每秒稳定的62至64帧的速度渲染7.96亿点(12.7GB)。这对应于约802GB / s,或每秒约500亿个点的吞吐量。
顶点顺序也强烈影响性能。 内存中连续的点的某些局部性是有益的,但是如果局部性过大,如果导致数千个GPU线程尝试更新单个像素,则会导致速度急剧下降。 因此,Morton排序缓冲区和混洗缓冲区都不是最佳的。 但是,通过首先按Morton代码进行排序,然后对128个点的批处理进行混洗,然后按顺序将批处理中的点保留在一起,可以实现改进的排