要在网格上轻松找到一个点,您需要一个坐标系。例如,如果网格恰好是您的 iPhone 15 屏幕,则中心点可能是 x:197、y:426。但是,该点可能会有所不同,具体取决于它所处的空间。
在上一章中,您了解了矩阵。通过将顶点的位置乘以特定矩阵,可以将顶点位置转换为不同的坐标空间。顶点在经过渲染管线时通常有 6 种空间:
1.物体局部空间
2.世界空间
3.相机空间
4.裁剪空间
5.规格化设备空间:NDC(Normalized Device Coordinate)
6.屏幕空间
这么多空间,听起来就像我们坐着宇宙飞船要冲出太阳系一样。让我们先对每个空间有一个具体的概念。
物体局部空间
我们之前学习的时候,应该都听过笛卡尔坐标系吧!下图显示的是一个2D的笛卡尔坐标,用2D的格子表示了图像的不同顶点的坐标。
这里的点的坐标都是相对狗狗图的原点来说的,这里的坐标原点(0, 0)是在狗狗的两只脚的中间。它们在这里被叫做物体局部空间(或 模型空间)。在上一章中,Triangle 在对象空间中保存了一个顶点数组,用于描述三角形每个顶点坐标。
世界空间
在接下来的图片,方向箭头标识了原点位置。世界空间的中心位置在(0, 0, 0)。在世界空间中,狗狗是在(1, 0, 1)的位置,而猫猫是在(-1, 0, -2)的位置。
不过,猫猫仍然会觉得自己在世界的中心,所以在猫的空间,猫觉得它自己是在(0, 0, 0),这就让狗狗的位置在猫的世界空间的(2, 0, 3)位置。当猫走动时,在它的世界空间中,它会觉得自己总在(0, 0, 0),而世界的其他物体都相对猫反向移动。
注意:猫空间并不会作为常用的3D坐标空间,只是说在数学概念上可以创建一个猫专属的空间。
相机空间
对于狗来说,世界的中心是对着它们拍照的、拿着相机的人。在相机空间中,相机本身是在(0, 0, 0),而狗狗大概是在(-3, -2, 7)的位置。当相机移动时,相机的位置一直保持在(0, 0, 0),而狗和猫会相对相机移动。
裁剪空间
这个空间存在的意义是,用透视来投影。换句话说就是,我们需要把一个3D场景带到一个2D空间。裁剪空间是一个扭曲的立方体,并准备好扁平处理。
在此场景中,狗和猫的大小相同,但由于狗在 3D 空间中的位置,狗看起来更小。在这里,狗比猫更远,所以他看起来更小。
注意,如果我们要工程制图的话,我们可能需要使用正交投影而不是透视投影。
NDC空间
投影到裁剪空间时创建了一个w大小的半立方体盒子。在光栅化时,GPU会转换w到正交坐标系的点,x和y轴的取值范围规格化到-1到1,而z轴的取值范围规格化到0到1。
屏幕空间
现在GPU已经有一个正交化的立方体了。它会把裁剪空间平面化,并且转换到屏幕坐标系中,准备好显示到设备的屏幕中。(比如在iphone12,屏幕空间分辨率应该是2532*1170 )。
在下图中,虽然狗和猫差不多大小,但是狗狗离相机远一些,所以看起来略小。
在不同空间中转换
可以使用变换矩阵从一个空间转换到另一个。在下图中,左边图中狗狗耳朵上的顶点,在狗的局部坐标系中是(-1, 4, 0)的位置上。在右图中,狗狗已经在世界空间上了,它耳朵上的点大概在(0.75, 1.5, 1)的世界位置上。
为了把狗狗的顶点从局部空间变换到世界空间,使用一个变换矩阵即可。我们可以移动它们,也可以缩放它们。
有4个空间需要我们控制,可以使用3个矩阵在它们之间转换:
如上图,我们可以看到这几个关键的变换矩阵:
- model matrix: 从“局部空间”变换到“世界空间”
- view matrix: 从“世界空间”变换到“相机空间”
- model matrix: 从“相机空间”变换到“裁剪空间”
坐标系统
不同的图形API使用不同的系统。我们已经看到了Metal的NDC空间在z轴取值范围是0到1。你可能熟悉OpenGL,它的NDC空间,z轴取值范围是-1到1.
除了z轴有不同的取值范围,OpenGL的z轴是指向和Metal的z轴相反的方向。OpenGL的坐标系统是右手坐标系统,而Metal的坐标系统是左手坐标系统。两种坐标系统都用x指向右边,y轴指向上面。
Blender使用另一种坐标系统,z轴指向上面,y指向屏幕里面。(其实是右手坐标系的变种)。
如果我们需要坚持自己熟悉的坐标系统,也是可以的,你用哪个坐标系统其实关系不大。本书为了方便,使用Metal默认的左手坐标系统,不过我们未来依然可以改成右手系统,只要使用不同的矩阵创建方法就行了。
起始项目
更好地了解坐标系和空间后,您就可以开始创建矩阵了。
➤ 在 Xcode 中,打开本章的入门项目并构建并运行应用程序。
该项目类似于您在第 2 章 “3D 模型” 中设置的 playground,您在其中渲染了 train.usdz。
Mathlibrary.swift(位于Utility中)包含用于创建平移,缩放和旋转矩阵的Float4x4上扩展的方法。该文件还包含float2/3/4的Typealiases,因此您无需键入SIMD_FLOAT2/3/4。
Model.Swift包含模型初始化和加载代码。
Rendering.swift具有模型的扩展。您从Renderer’s draw(in:)调用Model.render(encoder:)来渲染模型。
vertexdescriptor.swift创建一个默认的MDLVertexDescriptor。默认的MDLVertexDescriptor源自此描述符。当使用Model I/O加载模型带有顶点描述符时,代码可能会有点冗长。与其创建MDLVertexDescriptor,不如创建Model I/O MDLVertexDescriptor,然后使用MTKMetalVertexDescriptorFromModelIO(_:)将其转换为管道状态对象需要的MTLVertexDescriptor。如果您检查上一章中的顶点描述符代码,则那两个顶点描述符都使用相同的过程。分别描述属性和布局。
目前,您的火车:
•占用屏幕的整个宽度。
•没有深度透视感。
•拉伸至适合应用程序窗口的大小。
您可以将火车带入其他坐标空间,从而将火车的顶点位置从窗口尺寸中分离出来。顶点函数负责把火车顶点变换到不同的空间,在这里您将执行在不同空间之间进行转换的矩阵乘法。
Uniforms
在所有顶点或片段中相同的常量值通常称为 uniform。第一步是创建一个 uniform 结构体来保存转换矩阵。之后,您将 uniform 应用于每个顶点。
Swift端的着色器和代码都将访问这些uniform值。如果要在 Renderer 中创建一个结构体,并在 Shaders.metal 中创建一个匹配的结构体,则很可能会忘记使它们保持同步。因此,最好的方法是创建一个 C++ 和 Swift 都可以访问的桥接头文件。
您现在将执行如下操作:
➤ 使用 macOS 头文件模板,在着色器组中创建一个新文件,并将其命名为 Common.h。
➤ 在 Project navigator 中,单击主 Spaces 项目文件夹。
➤ 选择项目 Spaces,然后选择顶部的 Build Settings。确保将突出显示 All 和 Combined。
➤ 在搜索栏中,键入 bridg 以过滤设置。双击 Objective-C Bridging Header 值并输入 Spaces/Shaders/Common.h。
此配置指示 Xcode 将此文件用于基于C++的 Metal Shading Language 和 Swift。
➤ 在 Common.h 中,在最终 #endif 之前,添加以下代码:
#import <simd/simd.h>
此代码导入 simd 框架,该框架提供用于处理向量和矩阵的类型和函数。
➤ 接下来,添加 uniforms 结构:
typedef struct {matrix_float4x4 modelMatrix;matrix_float4x4 viewMatrix;matrix_float4x4 projectionMatrix;
} Uniforms;
这三个矩阵(每个矩阵有 4 行和 4 列)将保存不同空间之间的必要转换。
模型矩阵
火车顶点当前位于对象空间中。要将这些顶点转换为世界空间,您将使用 modelMatrix。通过更改 modelMatrix,您将能够平移、缩放和旋转您的火车。
➤ 在 Renderer.swift 中,将新结构添加到 Renderer:
var uniforms = Uniforms()
您在 Common.h(桥接头文件)中定义了 Uniforms,因此 Swift 能够识别 Uniforms 类型。
➤ 在 init(metalView:) 底部,添加:
let translation = float4x4(translation: [0.5, -0.4, 0])
let rotation =float4x4(rotation: [0, 0, Float(45).degreesToRadians])
uniforms.modelMatrix = translation * rotation
在这里,您将使用 MathLibrary.swift 中的矩阵实用程序方法。您将 modelMatrix 设置为向右平移 0.5 个单位,向下平移 0.4 个单位,逆时针旋转 45 度。
➤ 在 draw(in:) 的 model.render(encoder: renderEncoder) 之前,添加以下内容:
renderEncoder.setVertexBytes(&uniforms,length: MemoryLayout<Uniforms>.stride,index: 11)
此代码在 Swift 端设置uniform矩阵值。
➤ 打开 Shaders.metal,并在设置命名空间后导入桥接头文件:
#import “Common.h”
➤ 将 vertex 函数更改为:
vertex VertexOut vertex_main(VertexIn in [[stage_in]],constant Uniforms &uniforms [[buffer(11)]])
{float4 position = uniforms.modelMatrix * in.position;VertexOut out {.position = position};return out;
}
在这里,您接收 Uniforms 结构体作为参数,然后将所有顶点乘以模型矩阵。
➤ 构建并运行应用程序。
在 vertex 函数中,将顶点位置乘以模型矩阵。所有顶点都旋转,然后平移。火车顶点位置仍然与屏幕的宽度有关,因此火车看起来被拉伸了。您稍后会解决这个问题。
视图矩阵
为了转换世界空间到相机空间,我们需要设置好一个视图矩阵。依赖我们想如何移动你的相机,我们可以恰当地构建视图矩阵。我们这里构建一个最简单的矩阵,可以提供给FPS(第一人称射击)类型的游戏用。
➤ 在 Renderer.swift 中 init(metalView:) 末尾,添加以下代码:
uniforms.viewMatrix = float4x4(translation: [0.8, 0, 0]).inverse
请记住,场景中的所有对象都应沿与摄像机相反的方向移动。inverse 执行相反的转换。因此,当摄像机向右移动时,世界上的所有内容似乎都会向左移动 0.8 个单位。使用此代码,您可以在世界空间中设置相机,然后添加 .inverse,这样其他物体会相对于相机进行相反的变换。
在Shaders.metal中,修改代码:
float4 position = uniforms.modelMatrix * vertexIn.position;
为:
float4 position = uniforms.viewMatrix * uniforms.modelMatrix * vertexIn.position;
构建并运行app。
火车向左移动 0.8 个单位。稍后,您将能够使用键盘在场景中导航,只需更改视图矩阵即可更新摄像机周围场景中的所有对象。
最后一个矩阵将准备顶点以从摄像机空间移动到剪辑空间。此矩阵还允许您使用单位值,而不是您一直在使用的 -1 到 1 NDC(标准化设备坐标)。为了演示为什么这样做是必要的,您将向火车添加一些动画并在 y 轴上旋转它。
➤ 打开 Renderer.swift,然后在 draw(in:) 中,就在以下代码的上方:
renderEncoder.setVertexBytes(&uniforms,length: MemoryLayout<Uniforms>.stride,index: 11)
添加如下代码:
timer += 0.005
uniforms.viewMatrix = float4x4.identity
let translationMatrix = float4x4(translation: [0, -0.6, 0])
let rotationMatrix = float4x4(rotationY: sin(timer))
uniforms.modelMatrix = translationMatrix * rotationMatrix
在这里,您将重置相机视图矩阵,并将模型矩阵替换为绕 y 轴的旋转。
➤ 构建并运行应用程序。
您可以看到,当火车旋转时,z 轴上任何大于 1.0 的顶点都会被裁剪。Metal NDC 之外的任何顶点都将被剪切。
投影
现在是时候对渲染应用一些透视来为场景提供一些深度了。
下图显示了一个 3D 场景。在右下角,您可以看到渲染的场景将如何显示。
渲染场景时,需要考虑:
- 场景的多少将要填充到屏幕,我们的眼睛的视野角度大概是200°,在这个视野角度下,我们看计算机的屏幕的宽度时大概用了70°左右。
- 我们最远能看到多远,需要定义一个远平面,计算机并不能看到无限远的事物。
- 我们最近能看到多近,需要定义一个近平面,上图上比近平面更近的老鼠是看不到的。
- 屏幕的长宽比是多少。当前,我们的火车会随着窗口的拉伸而变形。当我们实时更新长宽比时,就不会出现这个拉伸变形的问题了。
上图已经把所有概念说清楚了。我们相机能看到的空间的造型是一个截取了顶部的锥体,我们把它叫做平截头体或视锥体。任何在视锥体之外的东西都不会被渲染。
再次将渲染图像与场景设置进行比较。场景中的老鼠不会渲染,因为它位于近平面的前面。
MathLibrary.swift 提供了一种 projection 方法,该方法返回矩阵以将此视锥体内的对象投影到剪裁空间,以便转换为 NDC 坐标。
投影矩阵
打开Renderer.swift,在init(metalView:)函数的后面,创建投影矩阵:
let aspect =Float(view.bounds.width) / Float(view.bounds.height)
let projectionMatrix =float4x4(projectionFov: Float(45).degreesToRadians,near: 0.1,far: 100,aspect: aspect)
uniforms.projectionMatrix = projectionMatrix
每当视图大小发生变化时,都会调用此委托方法。由于纵横比将发生变化,因此必须重置投影矩阵。
你正在使用 45° 的视野;近平面为 0.1,远平面为 100 个单位。
➤ 在 init(metalView:) 的末尾,添加以下内容:
mtkView(metalView,drawableSizeWillChange: metalView.drawableSize)
当 metalView.autoResizeDrawable 为 true(默认值)时,每当视图大小发生变化时,视图的可绘制对象大小都会自动更新。视图创建的任何可绘制纹理都将具有此大小。
此代码可确保您在应用程序开始时设置投影矩阵。
注意:在应用程序开始时调用 mtkView(_:drawableSizeWillChange:) 在这里并不是绝对必要的。SwiftUI 视图的框架具有固定高度,但不是固定宽度,因此视图无论如何都会在 App 开始时调整大小。但是,如果您在 SwiftUI 中同时设置视图frame的宽度和高度,则视图不会调整大小,因此不会初始化投影矩阵。
➤ 在 Shaders.metal 的 vertex 函数中,将位置矩阵计算更改为:
float4 position =uniforms.projectionMatrix * uniforms.viewMatrix* uniforms.modelMatrix * in.position;
编译、运行程序:
由于投影矩阵的原因,现在z 坐标的测量方式不同,火车目前处于放大中。
➤ 在 Renderer.swift 的 draw(in:) 中,替换:
uniforms.viewMatrix = float4x4.identity
为:
uniforms.viewMatrix = float4x4(translation: [0, 0, -3]).inverse
这会将摄像机从场景中向后移动三个单位。构建并运行:
➤ 在 mtkView(_:drawableSizeWillChange:) 中,将投影矩阵的 projectionFOV 参数更改为 70°,然后构建并运行应用程序。
火车看起来更小,因为视野更宽,并且渲染场景水平方向上可以显示更多的对象。
注: 对投影值和模型变换进行一些试验。在 draw(in:) 中,将 translationMatrix 的 z 平移值设置为距离 97,这样火车的前部就可以看到了。在 z = 98 时,火车不再可见。因为投影的far值为 100 个单位,摄像机为向后 3 个(也就是-3)单位。如果将投影的 far 参数更改为 1000,则火车将再次可见。
➤ 要渲染实心火车,请在 draw(in:) 中删除:
renderEncoder.setTriangleFillMode(.lines)
透视除法
现在我们已经把我们的顶点从局部空间变换到世界空间,然后到相机空间,最后变换到裁剪空间,GPU会自动帮我们把裁剪空间变换到NDC空间(在x和y轴限制为-1到1,在z轴限制为0到1)。由于目标是把裁剪空间的所有顶点缩放到NDC空间,所以需要使用第四个分量:w。
要缩放一个点,例如(1, 2, 3),我们可以使用第四个分量:(1, 2, 3, 3)。把所有分量都除以第四分量(1/3, 2/3, 3/3, 1)。这样xyz值就缩小了。这个坐标系并称为齐次坐标系。
投影矩阵把视锥体的顶点投影到一个立方体,它的范围是-w到w。当顶点从顶点shader函数处理完毕后,GPU会执行透视除法,并且把x, y, 和z值除以它们的w值。w值越大,它在坐标系越靠后。结果是,所有可视物体的顶点都变换到了NDC中。
注:为了避免除零操作,近平面应该总是大于0。
w 值是 float4 向量方向和 float4 位置之间的主要区别。由于透视除法,位置中必须具有 w 值(通常为 1)。而向量的 w 值应该是 0,因为它不经过透视除法。
在下图中,狗和猫的身高相同 — 例如,y 值可能为 2。使用投影时,由于狗狗的位置更靠后,因此它在最终渲染中应该显得更小。
投影后,猫的 w 值可能为 ~1,而狗的 w 值可能为 ~8。除以 w 会得到猫的身高为 2,狗的身高为 1/4,这将使狗看起来更小。
NDC到屏幕
最后,GPU 将标准化坐标转换为设备屏幕大小。在职业生涯的某个时候,在标准化坐标和屏幕坐标之间进行转换时,您可能已经做过类似的事情。
要将介于 -1 和 1 之间的 Metal NDC(标准化设备坐标)转换为设备,您可以使用如下方法:
converted.x = point.x * screenWidth/2 + screenWidth/2
converted.y = point.y * screenHeight/2 + screenHeight/2
但是,您也可以使用矩阵来实现此目的,方法是缩放屏幕大小一半并平移屏幕大小的一半。此方法的明显优点是,您可以设置一次转换矩阵,然后将任何标准化点乘以该矩阵,使用如下代码将其转换为正确的屏幕空间:
converted = matrix * point
GPU 上的光栅器会为您处理矩阵计算。
重构模型矩阵
目前,您在 Renderer 中设置所有矩阵。稍后,您将创建一个 Camera 结构来计算视图和投影矩阵。
使用模型矩阵,可以移动的任何对象(例如模型或相机)都可以保持位置、旋转和缩放,而不是直接更新它。根据此信息,您可以构建模型矩阵。
➤ 创建一个名为 Transform.swift 的新 Swift 文件
➤ 添加新结构体:
struct Transform {var position: float3 = [0, 0, 0]var rotation: float3 = [0, 0, 0]var scale: Float = 1
}
此结构体将保存您可以移动的任何对象的转换信息。
➤ 添加具有计算属性的扩展:
extension Transform {var modelMatrix: matrix_float4x4 {let translation = float4x4(translation: position)let rotation = float4x4(rotation: rotation)let scale = float4x4(scaling: scale)let modelMatrix = translation * rotation * scalereturn modelMatrix
} }
此代码会自动从任何可转换对象创建模型矩阵。
➤ 添加新协议,以便您可以将对象标记为可转换:
protocol Transformable {var transform: Transform { get set }
}
➤ 因为键入 model.transform.position 有点啰嗦,所以为 Transformable 添加了一个新的扩展:
extension Transformable {var position: float3 {get { transform.position }set { transform.position = newValue }}var rotation: float3 {get { transform.rotation }set { transform.rotation = newValue }}var scale: Float {get { transform.scale }set { transform.scale = newValue }}
}
此代码提供了计算属性,允许您直接使用 model.position,并且模型的transform会根据此值更新。
➤ 打开 Model.swift,并将 Model 遵循Transformable协议。
class Model: Transformable {
➤ 将新的 transform 属性添加到 Model:
var transform = Transform()
➤ 打开 Renderer.swift,然后从 init(metalView:) 中删除:
let translation = float4x4(translation: [0.5, -0.4, 0])
let rotation =float4x4(rotation: [0, 0, Float(45).degreesToRadians])
uniforms.modelMatrix = translation * rotation
uniforms.viewMatrix = float4x4(translation: [0.8, 0, 0]).inverse
您将在 draw(in:) 中设置这些矩阵。
➤ 在 draw(in:) 中,替换:
let translationMatrix = float4x4(translation: [0, -0.6, 0])
let rotationMatrix = float4x4(rotationY: sin(timer))
uniforms.modelMatrix = translationMatrix * rotationMatrix
➤ 为:
model.position.y = -0.6
model.rotation.y = sin(timer)
uniforms.modelMatrix = model.transform.modelMatrix
➤ 构建并运行应用程序。
结果完全相同,但代码更易于阅读,并且也更容易更改模型的位置、旋转和缩放。稍后,您将此代码提取到 GameScene 中,以便 Renderer 仅用于渲染模型,而不是操纵它们。
参考
https://zhuanlan.zhihu.com/p/390450725