薄板样条插值TPS原理以及torch和opencv实现

news/2024/9/21 1:16:37/

薄板样条插值TPS原理以及torch和opencv实现

TPS_1">1、薄板样条插值TPS原理

概述

薄板样条(Thin Plate Spline),简称TPS,是一种插值方法,可找到通过所有给定点的“最小弯曲”光滑曲面。因为它一般都是基于2D插值,所以经常用在在图像配准中,也可以用于图像扭曲变形(扩充图像)。在两张图像中找出N个匹配点,应用TPS可以将这N个点形变到对应位置,同时给出了整个空间的形变(插值)。
在使用TPS图像配准过程中,需要输入原始图像初始点(也就是变换前像素点的位置),和目标图像的目标点(也就是变换之后像素点在目标图像中的位置)。通常为两张图像上的m组匹配点,如P1(x1,y1)->P1’(x1’,y1’)、P2(x2,y2)->P2’(x2’,y2’)…Pm(xm,ym)->Pm’(xm’,ym’)。可以通过Shift、Surf、Orb,以及光流跟踪等算法获取匹配点对。我们以文字扭曲变形为例,TPS算法就是将原始图像中的红色点,变换到目标图像中绿色点的过程,在这个过程中要求图像平面所在薄板弯曲变形所需的能量最小,能量公式如图1。
在这里插入图片描述

原理以及公式推导

在这里插入图片描述
图1
TPS形变的目标是求解一个函数f,使得f(Pi)=Pi’ (1≤i≤n),并且弯曲能量函数最小,同时图像上的其它点也可以通过插值函数f得到很好的校正。
可以证明薄板样条的插值函数就是弯曲能量最小的函数:
在这里插入图片描述
f(x,y) = [[xi’],
[yi’]]
在这里插入图片描述
因此
在这里插入图片描述
在这里插入图片描述
则公式中的前半部分可以表示成以下形式:
Pn×3 A3×2=
后半部分中的U可以表示成以下形式:
在这里插入图片描述
首先看基础函数在这里插入图片描述
的图像。
在这里插入图片描述
得到矩阵K
在这里插入图片描述
用K和P矩阵组合成L矩阵
在这里插入图片描述
令Y等于以下格式
在这里插入图片描述
则得
在这里插入图片描述
公式1
由上式得:
在这里插入图片描述
进而得到两个分解表达,第一个向量v表示的是目标点位置,向量o表示的是额外约束。
在这里插入图片描述
在上述表达式中,需要求解W和A矩阵,由公式1解得W和A矩阵:

在这里插入图片描述
到此,推到完毕。

2、torch实现

步骤解析:

  1. 先根据m个控制点求出w和a
    1.1. 构造P、K、Y矩阵
    1.2. 计算W、A
    1.3. 生成网格grid,并计算K,P
    1.4. 计算输出结果Y
  2. 然后可以根据输入点p得到目标点p’。
    p’ = p@a+k@w
    其中@表示点乘p的维度为m×3、a的3×2、k的m×m、w的m×2
  3. 在计算w和a的过程,m的值为控制点的数量。
  4. 在推理阶段,m的值为所有的像素点的数量n(n=H*W)。
python">import cv2
import numpy as np
import random
import torch
from torchvision.transforms import ToTensor, ToPILImage
DEVICE = torch.device("cpu")
def choice3(img):'''产生波浪型文字:param img::return:'''h, w = img.shape[0:2]N = 5pad_pix = 50points = []dx = int(w/ (N - 1))for i in range( N):points.append((dx * i,  pad_pix))points.append((dx * i, pad_pix + h))#加边框img = cv2.copyMakeBorder(img, pad_pix, pad_pix, 0, 0, cv2.BORDER_CONSTANT,value=(int(img[0][0][0]), int(img[0][0][1]), int(img[0][0][2])))#原点source = np.array(points, np.int32)source = source.reshape(1, -1, 2)#随机扰动幅度rand_num_pos = random.uniform(20, 30)rand_num_neg = -1 * rand_num_posnewpoints = []for i in range(N

http://www.ppmy.cn/news/1440084.html

相关文章

Android|记一个导致 logback 无法输出日志的问题

之前写过《Android|集成 slf4j logback 作为日志框架》,最近在给手上的另外一个 Android 项目添加 logback 日志框架时,遇到一个导致无法输出日志到文件的问题,也耽误了不少时间,这里记录一下。 现象 代码里通过 Slf4…

Istio介绍

1.什么是Istio Istio是一个开源的服务网格(Service Mesh)框架,它提供了一种简单的方式来为部署在Kubernetes等容器编排平台上的微服务应用添加网络功能。Istio的核心功能包括: 服务治理:Istio能够帮助管理服务之间的…

DRF 查询(排序、过滤、分页)

查询(排序、过滤、分页) 【0】准备 (1)Q查询 详细内容可见:Django模型层-CSDN博客Django 的 Q 对象提供了一种在数据库查询中构造复杂查询的方法。当你想在单个查询中组合多个过滤条件,并且这些条件之间不仅仅是简单的 AND 关系…

IDEA pom.xml依赖警告

IDEA中,有时 pom.xml 中会出现如下提示: IDEA 2022.1 升级了检测易受攻击的 Maven 和 Gradle 依赖项,并建议修正,通过插件 Package Checker 捆绑到 IDE 中。 这并不是引用错误,不用担心。如果实在强迫症不想看到这个提…

由对极约束得到基础矩阵

对极约束是计算机视觉中的一种几何约束,特别是在双目视觉和多目视觉系统中,用于解决摄像机相对姿态估计和三维重建的问题。对极几何基于两个摄像机在同一时刻拍摄同一场景的不同视图这一事实,研究的是同一空间点在不同摄像机图像平面上的投影…

MySQL 主主复制在生产环境常见的问题有哪些

MySQL 主主复制(Master-Master Replication)是一种常见的数据库架构,它可以提供高可用性和负载均衡。在生产环境中,可能会遇到以下常见问题: 数据冲突:在主主复制环境下,两个主库同时写入相同的…

HTTP慢连接攻击的原理和防范措施

随着互联网的快速发展,网络安全问题日益凸显,网络攻击事件频繁发生。其中,HTTP慢速攻击作为一种隐蔽且高效的攻击方式,近年来逐渐出现的越来越多。 为了防范这些网络攻击,我们需要先了解这些攻击情况,这样…

【漏洞复现】GB28181摄像头管理平台user未授权漏洞

漏洞描述: GB28181是公共安全视频监控联网系统信息传输、交换、控制技术要求的标准。该标准主要定义了基于IP网络的音视频监控系统的整体架构,包括前端设备、存储设备、管理平台等组成部分,以及设备接入、流媒体传输、信令交互、存储管理、安…