pytorch3d导入maya相机位姿踩坑

ops/2024/11/14 23:59:11/

目的是将maya中的相机无缝导入到pytorch3d

mayaTrans_pytorch3d_2">坑1: 直接导出maya中相机的欧拉角以及Trans, 然后直接导入pytorch3d

问题所在: maya中直接导出的相机旋转角以及Trans是 c2w, 而根据文档https://pytorch3d.org/docs/cameras 中的一句话, 经过R可以实现world to view的变换, 所以可以确定这个地方需要输入的参数其实是w2c
M c 2 w = [ R T 0 1 ] M_{c2w} = \begin{bmatrix} R & T \\ 0 & 1 \end{bmatrix} Mc2w=[R0T1], M w 2 c = M c 2 w − 1 = [ R T − R T T 0 1 ] M_{w2c} =M_{c2w} ^{-1}= \begin{bmatrix} R^T & -R^T T \\ 0 & 1 \end{bmatrix} Mw2c=Mc2w1=[RT0RTT1]
转换后输入即可

坑2: 坐标系不同, 需要先进行坐标系变换在这里插入图片描述

各个系统的坐标系如上图所示, 其中maya的坐标系与OpenGL相同, pytorch3d的坐标系需要将xz轴反向, 具体实现代码如下:

        R_py3d = R.clone().TT_py3d = T.clone()R_py3d[:, [0, 2]] *= -1  # 变换坐标系T_py3d[[0, 2]] *= -1

这里的实现参考了 pytorch3d/renderer/camera_conversions.py 中的_cameras_from_opencv_projection 方法, 这个方法是将opencv的相机变成pytorch3d, 这2个变换的相似点是都有一个轴固定, 然后旋转180°

def _cameras_from_opencv_projection(R: torch.Tensor,tvec: torch.Tensor,camera_matrix: torch.Tensor,image_size: torch.Tensor,
) -> PerspectiveCameras:focal_length = torch.stack([camera_matrix[:, 0, 0], camera_matrix[:, 1, 1]], dim=-1)principal_point = camera_matrix[:, :2, 2]# Retype the image_size correctly and flip to width, height.image_size_wh = image_size.to(R).flip(dims=(1,))# Screen to NDC conversion:# For non square images, we scale the points such that smallest side# has range [-1, 1] and the largest side has range [-u, u], with u > 1.# This convention is consistent with the PyTorch3D renderer, as well as# the transformation function `get_ndc_to_screen_transform`.scale = image_size_wh.to(R).min(dim=1, keepdim=True)[0] / 2.0scale = scale.expand(-1, 2)c0 = image_size_wh / 2.0# Get the PyTorch3D focal length and principal point.focal_pytorch3d = focal_length / scalep0_pytorch3d = -(principal_point - c0) / scale# For R, T we flip x, y axes (opencv screen space has an opposite# orientation of screen axes).# We also transpose R (opencv multiplies points from the opposite=left side).R_pytorch3d = R.clone().permute(0, 2, 1)T_pytorch3d = tvec.clone()R_pytorch3d[:, :, :2] *= -1T_pytorch3d[:, :2] *= -1return PerspectiveCameras(R=R_pytorch3d,T=T_pytorch3d,focal_length=focal_pytorch3d,principal_point=p0_pytorch3d,image_size=image_size,device=R.device,)

其他变换相关的参考资料
blender to pytorch3d camera: https://github.com/facebookresearch/pytorch3d/issues/1105

坑3: 内参的导入问题

读取代码

        focal_length = torch.tensor([K[0, 0], K[1, 1]], dtype=torch.float32).unsqueeze(0)principal_point = torch.tensor([K[0, 2], K[1, 2]], dtype=torch.float32).unsqueeze(0)cameras = PerspectiveCameras(device=self.device, R=R_py3d.unsqueeze(0), T=T_py3d.unsqueeze(0),focal_length=focal_length, principal_point=principal_point, in_ndc=False, image_size=[[1024, 1024]])

这里需要注意, 当输入focal_length与principal_point时, 一定要注意 in_ndc 这个选项!
还需要注意分辨率要与maya设置的渲染分辨率对上, 根据目前的观测, 就是K[0][2] * 2

最终完整代码:

maya相机参数通过如下代码获得:

    def query_cam_pos(self, camera_name):cam, cam_shape = self.scene["cameras"][camera_name]focal_length = cmds.camera(cam_shape, q=True, fl=True)inches_to_mm = 25.4app_horiz = cmds.camera(cam_shape, q=True, hfa=True) * inches_to_mmapp_vert = cmds.camera(cam_shape, q=True, vfa=True) * inches_to_mmpixel_width = self.config['resolution'][0]pixel_height = self.config['resolution'][1]focal_length_x_pixel = pixel_width * focal_length / app_horizfocal_length_y_pixel = pixel_height * focal_length / app_verttranslate = cmds.getAttr(cam + ".translate")[0]eular_rot = cmds.getAttr(cam + ".rotate")[0]# convert_to_opencv_matrixK = np.eye(3)K[0, 0] = focal_length_x_pixelK[1, 1] = focal_length_y_pixelK[0, 2] = pixel_width / 2.0K[1, 2] = pixel_height / 2.0R = utils.eulerAngleToRoatationMatrix((math.radians(eular_rot[0]), math.radians(eular_rot[1]), math.radians(eular_rot[2])))return K, R, translate

pytorch3d中相机参数的读取代码

		# 将c2w变成w2cR = R.TT = - R @ T# 然后变换坐标轴, 绕y轴转180°R_py3d = R.clone().TT_py3d = T.clone()R_py3d[:, [0, 2]] *= -1  # 变换坐标系T_py3d[[0, 2]] *= -1focal_length = torch.tensor([K[0, 0], K[1, 1]], dtype=torch.float32).unsqueeze(0)principal_point = torch.tensor([K[0, 2], K[1, 2]], dtype=torch.float32).unsqueeze(0)cameras = PerspectiveCameras(device=self.device, R=R_py3d.unsqueeze(0), T=T_py3d.unsqueeze(0), focal_length=focal_length, principal_point=principal_point, in_ndc=False,image_size=[[1024, 1024]])

http://www.ppmy.cn/ops/133711.html

相关文章

云服务器和物理服务器的区别有哪些?

云服务器是服务器集群虚拟为多个性能可配的虚拟主机,云服务器的基础依旧是需要物理服务器的,要用海量的物理服务器集群进行建构,以此来形成云端虚拟资源池,根据企业的自身需求,来从资源池中进行资源分配。 物理服务器则…

3DTiles之i3dm介绍

3DTiles之i3dm介绍 3D Tiles 是一种用于高效存储和传输三维城市、建筑、地形、点云等空间数据的开放标准格式。i3dm(Intel 3D Model)是 3D Tiles 中用于表示三维模型(如建筑物或其他对象)的一个子格式。i3dm 格式的出现&#xff…

MongoDB在现代Web开发中的应用

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 MongoDB在现代Web开发中的应用 MongoDB在现代Web开发中的应用 MongoDB在现代Web开发中的应用 引言 MongoDB 概述 定义与原理 发展…

Sqoop学习

目录 一、Soop简介 二、Sqoop的安装 1. 上传压缩包到/opt/install目录下 2.解压 3.修改文件名 4.拷贝sqoop-1.4.7.bin__hadoop-2.6.0目录下的sqoop-1.4.7.jar包到/opt/soft/sqoop147目录下 5.拷贝sqoop-1.4.7.bin__hadoop-2.6.0/lib目录下该jar包到sqoop/lib目录下 6.复…

SOLIDWORKS代理商鑫辰信息科技

鑫辰信息科技是一家专业的SOLIDWORKS代理商,致力于为客户提供全面的CAD解决方案和技术支持。作为SOLIDWORKS的授权合作伙伴,鑫辰信息科技在机械设计、产品开发和工程仿真等领域拥有丰富的经验和专业知识,能够帮助客户有效提升设计和生产效率。…

Go 语言已立足主流,编程语言排行榜24 年 11 月

Go语言概述 Go语言,简称Golang,是由Google的Robert Griesemer、Rob Pike和Ken Thompson在2007年设计,并于2009年11月正式宣布推出的静态类型、编译型开源编程语言。Go语言以其提高编程效率、软件构建速度和运行时性能的设计目标,…

【Python】爬虫通过验证码

1、将验证码下载至本地 # 获取验证码界面html url http://www.example.com/a.html resp requests.get(url) soup BeautifulSoup(resp.content.decode(UTF-8), html.parser)#找到验证码图片标签,获取其地址 src soup.select_one(div.captcha-row img)[src]# 验证…

简单的TCP程序

文章目录 3. TCP程序3.1 接口3.1.1 inet_aton()3.1.2 listen()3.1.3 现在的服务器代码3.1.4 accept()3.1.5 inet_ntop()3.1.6 tcpClient.cc 3.2 并发的 tcpServer3.2.1 多进程版本3.2.2 多线程版本3.2.3 线程池版本 3.3 继续完善3.3.1 增加客户端重连功能3.3.2 守护进程 3. TCP…