【UE 渲染】什么是Draw Calls

0 引言
1 什么是Draw Calls
2 Draw Calls的工作原理
- 2.1 渲染管线概述
- 2.2 Draw Call的工作流程
- 2.3 Draw Call的开销
3 优化Draw Calls的方法
- 3.1 批处理（Batching）
- 3.2 实例化（Instancing）
- 3.3 合并网格（Mesh Merging）
- 3.4 使用LOD（Level of Detail）
- 3.5 材质合并（Material Merging）
4 在UE4中查看Draw Calls

请添加图片描述

🙋‍♂️ 作者：海码007
📜 专栏：UE虚幻引擎专栏
💥 标题：【UE 渲染】什么是Draw Calls
❣️ 寄语：书到用时方恨少，事非经过不知难！
🎈 最后：文章作者技术和水平有限，如果文中出现错误，希望大家能指正，同时有问题的话，欢迎大家留言讨论。

0 引言

在Unreal Engine 4（UE4）以及其他图形引擎中，“Draw Calls”（绘制调用）是一个非常重要的概念，特别是在渲染性能优化方面。

1 什么是Draw Calls

Draw Calls是指CPU向GPU发出的绘制命令。每个Draw Call告诉GPU如何渲染一部分场景，包括使用哪些顶点、纹理、着色器等。简单来说，Draw Call是CPU与GPU之间的通信桥梁，用于指示GPU绘制特定的图形。

2 Draw Calls的工作原理

Draw Calls（绘制调用）是图形渲染管线中的一个关键概念，特别是在实时渲染和游戏开发中。理解Draw Calls的工作原理有助于优化渲染性能。以下是详细的工作原理解析：

2.1 渲染管线概述

现代图形渲染管线通常分为以下几个阶段：（渲染管线的流程划分标准有很多，不唯一）

应用阶段（Application Stage）：在这个阶段，CPU负责准备渲染数据并发出Draw Calls。
几何阶段（Geometry Stage）：GPU接收顶点数据并进行几何处理，如顶点变换、裁剪等。
光栅化阶段（Rasterization Stage）：将几何数据转换为像素数据。
片段阶段（Fragment Stage）：对每个像素进行着色处理。
输出合并阶段（Output Merger Stage）：将处理后的像素数据写入帧缓冲区。

2.2 Draw Call的工作流程

以下是Draw Call在渲染管线中的详细工作流程：

准备数据：
- 顶点数据：包括顶点位置、法线、纹理坐标等。
- 索引数据：用于定义顶点的连接方式，形成三角形。
- 材质和纹理：定义物体的外观。
- 着色器：用于计算顶点和像素的最终颜色。
设置渲染状态：
- 着色器程序：绑定顶点着色器和片段着色器。
- 纹理和材质：绑定所需的纹理和材质。
- 渲染目标：设置帧缓冲区或渲染目标。
发出Draw Call：
- API调用：通过图形API（如DirectX、OpenGL、Vulkan等）发出绘制命令。例如，在OpenGL中使用glDrawElements，在DirectX中使用DrawIndexed。
- 命令缓冲区：绘制命令被放入命令缓冲区，等待GPU处理。
GPU处理：
- 顶点处理：顶点着色器对顶点数据进行变换和处理。
- 图元装配：将顶点数据组装成图元（如三角形）。
- 光栅化：将图元转换为片段（像素）。
- 片段处理：片段着色器对每个片段进行着色计算。
- 深度和模板测试：进行深度测试和模板测试，决定片段是否被写入帧缓冲区。
- 颜色混合：将片段颜色与帧缓冲区中的现有颜色进行混合。
输出到帧缓冲区：
- 帧缓冲区：最终的像素数据被写入帧缓冲区，准备显示在屏幕上。

2.3 Draw Call的开销

每个Draw Call都有一定的开销，主要包括：

CPU开销：准备数据、设置渲染状态、发出绘制命令等。
GPU开销：处理顶点、光栅化、片段着色等。

大量的Draw Calls会导致CPU和GPU之间的通信开销增加，从而影响渲染性能。

3 优化Draw Calls的方法

优化Draw Calls是提高渲染性能的关键步骤，特别是在实时渲染和游戏开发中。以下是几种常见的优化Draw Calls的方法：

3.1 批处理（Batching）

批处理是将多个小的绘制命令合并成一个大的绘制命令，以减少Draw Calls的数量。

假设我们有多个相同材质的立方体需要绘制：

// 不使用批处理的绘制方式
for (const auto& cube : cubes) {SetMaterial(cube.material);DrawMesh(cube.mesh);
}

使用批处理将这些立方体合并成一个绘制命令：

// 使用批处理的绘制方式
SetMaterial(commonMaterial);
DrawMeshInstanced(cubeMesh, cubes);

在这个示例中，DrawMeshInstanced函数将多个立方体合并成一个绘制命令，从而减少了Draw Calls的数量。

3.2 实例化（Instancing）

实例化技术允许一次性绘制多个相同的几何体（如树木、草丛等），从而减少Draw Calls。

假设我们有多个相同的树模型需要绘制：

// 不使用实例化的绘制方式
for (const auto& tree : trees) {SetMaterial(tree.material);DrawMesh(tree.mesh);
}

使用实例化技术：

// 使用实例化的绘制方式
SetMaterial(treeMaterial);
DrawMeshInstanced(treeMesh, trees);

在这个示例中，DrawMeshInstanced函数将多个树模型合并成一个绘制命令，从而减少了Draw Calls的数量。

3.3 合并网格（Mesh Merging）

将多个小的网格合并成一个大的网格，以减少Draw Calls。

假设我们有多个小的静态物体需要绘制：

// 不使用网格合并的绘制方式
for (const auto& object : objects) {SetMaterial(object.material);DrawMesh(object.mesh);
}

使用网格合并技术：

// 使用网格合并的绘制方式
Mesh mergedMesh = MergeMeshes(objects);
SetMaterial(commonMaterial);
DrawMesh(mergedMesh);

在这个示例中，MergeMeshes函数将多个小的网格合并成一个大的网格，从而减少了Draw Calls的数量。

3.4 使用LOD（Level of Detail）

根据物体与相机的距离，使用不同的细节级别来绘制物体，从而减少远处物体的绘制复杂度。

假设我们有一个复杂的模型需要绘制：

// 不使用LOD的绘制方式
SetMaterial(complexModel.material);
DrawMesh(complexModel.mesh);

使用LOD技术：

// 使用LOD的绘制方式
if (distanceToCamera < nearThreshold) {SetMaterial(highDetailModel.material);DrawMesh(highDetailModel.mesh);
} else if (distanceToCamera < farThreshold) {SetMaterial(mediumDetailModel.material);DrawMesh(mediumDetailModel.mesh);
} else {SetMaterial(lowDetailModel.material);DrawMesh(lowDetailModel.mesh);
}

在这个示例中，根据物体与相机的距离，选择不同的细节级别来绘制物体，从而减少了远处物体的绘制复杂度。

3.5 材质合并（Material Merging）

将多个材质合并成一个材质，以减少材质切换的开销。

假设我们有多个不同材质的物体需要绘制：

// 不使用材质合并的绘制方式
for (const auto& object : objects) {SetMaterial(object.material);DrawMesh(object.mesh);
}

使用材质合并技术：

// 使用材质合并的绘制方式
Material mergedMaterial = MergeMaterials(objects);
SetMaterial(mergedMaterial);
DrawMesh(mergedMesh);

在这个示例中，MergeMaterials函数将多个材质合并成一个材质，从而减少了材质切换的开销。

UE4Draw_Calls_186">4 在UE4中查看Draw Calls

在UE4中，你可以使用内置的性能分析工具来查看Draw Calls的数量和其他渲染性能指标。以下是一些常用的方法：

Stat命令：在控制台中输入stat scenerendering命令，可以查看当前场景的渲染统计信息，包括Draw Calls的数量。
Profiler：使用UE4的Profiler工具，可以详细分析渲染性能，包括Draw Calls的数量和开销。
Unreal Insights：这是一个更高级的性能分析工具，提供了更详细的性能数据和可视化。