【CV】opencv调用DIS/LK等计算光流,前一帧和当前帧写反了有什么影响?

news/2024/9/22 13:42:48/

当在计算光流时,将前一帧和当前帧输入反了,会导致一系列问题。

在计算光流时,通常是将前一帧作为模板,根据当前帧计算光流。因为光流是描述相邻帧之间像素移动的一种方法,它通过比较两帧之间的像素强度或特征点的移动来计算物体的运动情况。

在计算光流时,常用的方法之一是利用Lucas-Kanade光流算法,该算法假设在一个局部区域内,像素的运动是基本相似的。因此,它通过比较当前帧与前一帧之间的像素差异来估计光流向量。

此外,在计算光流时通常使用多尺度图像金字塔来处理不同尺度上的运动。多尺度图像金字塔包含了同一图像的不同分辨率版本,通过在不同尺度上计算光流,可以更好地捕捉到不同尺度下的运动信息,提高光流估计的准确性和鲁棒性。多尺度图像金字塔是基于当前帧计算的。在计算光流时,首先会对当前帧进行多尺度处理,生成多个尺度的图像金字塔。然后,针对每个尺度的图像金字塔,利用前一帧与当前帧之间的像素差异来估计光流向量。这样做的目的是为了在不同尺度下更全面地捕捉到图像中物体的运动信息,从而提高光流估计的准确性和鲁棒性。如果写反了,多尺度图像金字塔不一样,搜索比对模板也不一样,结果会不一样,总的说来有以下几个方面影响

错误的运动估计:Lucas-Kanade光流算法假设相邻帧之间的像素运动是基本相似的,因此它通过比较两帧之间的像素差异来估计运动。如果反转了帧的顺序,算法会尝试在错误的方向上寻找运动,导致错误的运动估计。

不稳定的结果:由于算法期望输入的帧顺序是正确的,因此反转帧的顺序可能导致算法在不同场景下表现不一致。这可能会导致光流向量的异常或不稳定的结果,因为算法会试图适应错误的输入。

算法性能下降:Lucas-Kanade算法基于一系列假设和约束来进行光流计算,其中之一是相邻帧之间的像素运动是相似的。如果这些假设被违反,算法内部的一些计算步骤可能无法正确执行,导致性能下降。

本文最后给两个光流计算示例

  1. Dense Optical Flow (DIS) 示例代码:
import cv2# 读取视频
cap = cv2.VideoCapture('input_video.mp4')# 创建DIS对象
dis = cv2.DISOpticalFlow_create(cv2.DISOPTICAL_FLOW_PRESET_ULTRAFAST)# 读取第一帧
ret, frame1 = cap.read()
prvs = cv2.cvtColor(frame1,cv2.COLOR_BGR2GRAY)# 读取剩余帧并计算光流
while(1):ret, frame2 = cap.read()if not ret:breaknext = cv2.cvtColor(frame2,cv2.COLOR_BGR2GRAY)# 计算光流flow = dis.calc(prvs, next, None)# 显示光流# 这里可以根据需要对光流进行可视化# 例如绘制光流向量或者光流场# ...# 更新前一帧prvs = nextif cv2.waitKey(30) & 0xFF == ord('q'):breakcap.release()
cv2.destroyAllWindows()
  1. Lucas-Kanade (LK) 光流算法示例代码:
import cv2
import numpy as np# 读取视频
cap = cv2.VideoCapture('input_video.mp4')# 设置LK光流参数
lk_params = dict(winSize=(15, 15),maxLevel=2,criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03))# 读取第一帧
ret, old_frame = cap.read()
old_gray = cv2.cvtColor(old_frame, cv2.COLOR_BGR2GRAY)# 选择一些特征点作为跟踪点
p0 = cv2.goodFeaturesToTrack(old_gray, mask=None, maxCorners=100, qualityLevel=0.3, minDistance=7, blockSize=7)# 创建一个颜色用于绘制跟踪点
color = np.random.randint(0, 255, (100, 3))# 开始追踪特征点
while(1):ret, frame = cap.read()if not ret:breakframe_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 计算光流p1, st, err = cv2.calcOpticalFlowPyrLK(old_gray, frame_gray, p0, None, **lk_params)# 选择良好的跟踪点good_new = p1[st == 1]good_old = p0[st == 1]# 绘制轨迹for i, (new, old) in enumerate(zip(good_new, good_old)):a, b = new.ravel()c, d = old.ravel()frame = cv2.circle(frame, (a, b), 5, color[i].tolist(), -1)frame = cv2.line(frame, (a, b), (c, d), color[i].tolist(), 2)# 显示结果cv2.imshow('frame', frame)k = cv2.waitKey(30) & 0xffif k == 27:break# 更新下一帧的特征点old_gray = frame_gray.copy()p0 = good_new.reshape(-1, 1, 2)cv2.destroyAllWindows()
cap.release()

http://www.ppmy.cn/news/1461907.html

相关文章

python读取excel数据写入mysql

概述 业务中有时会需要解析excel中的数据,按照要求处理后,写入到db中; 用python处理这个正好简便快捷 demo 没有依赖就 pip install pymysql一下 import pymysql from pymysql.converters import escape_string from openpyxl import loa…

[ffmpeg处理指令]

1 将h264转为mp4 ffmpeg -f h264 -i front_far_0.264 -vcodec copy front_far_0.mp4 ffmpeg -f h264 -i front_near_0.264 -vcodec copy front_near_0.mp4 -i:表示输入文件 front_far_2.mp4:表示输出文件 2 h264转为图片 front_far 是目标路径,需要…

常见加解密算法02 - RC4算法分析

RC4是一种广泛使用的流密码,它以其简洁和速度而闻名。区别于块密码,流密码特点在于按位或按字节来进行加密。 RC4由Ron Rivest在1987年设计,尽管它的命名看起来是第四版,实际上它是第一个对外发布的版本。 RC4算法的实施过程简洁…

Retrying,一个神奇优雅的 Python 库

大家好!我是爱摸鱼的小鸿,关注我,收看每期的编程干货。 一个简单的库,也许能够开启我们的智慧之门, 一个普通的方法,也许能在危急时刻挽救我们于水深火热, 一个新颖的思维方式,也许能…

OpenAI GPT-4o震撼登场:实时响应、全能交互的AI新体验、再登新峰!

OpenAI 刚刚发布了 GPT-4o,这是一种新的人工智能模式,集合了文本、图片、视频、语音的全能模型。 能实时响应用户的需求,并通过语音来实时回答你,你可以随时打断它。 还具有视觉能力,能识别物体并根据视觉做出快速的响…

使用html和css实现个人简历表单的制作

根据下列要求,做出下图所示的个人简历(表单) 表单要求 Ⅰ、表格整体的边框为1像素,单元格间距为0,表格中前六列列宽均为100像素,第七列 为200像素,表格整体在页面上居中显示; Ⅱ、前…

IP代理中的SOCKS5代理是什么?安全吗?

在互联网世界中,网络安全和个人隐私保护变得日益重要。SOCKS5代理作为一种安全高效的网络工具,不仅可以保护个人隐私安全,还可以提供更稳定、更快度的网络连接。本文将带大家深入了解SOCKS5代理在网络安全领域中的应用。 什么是SOCKS5代理 …

设计模式——备忘录模式(Memento)

备忘录模式(Memento Pattern),也称为快照模式或Token模式,是GoF(Gang of Four,四位设计模式专家)提出的23种设计模式之一,属于行为模式。该模式的主要目的是在不破坏封装性的前提下&…