OpenCV基于均值漂移算法(pyrMeanShiftFiltering)的水彩画特效

embedded/2025/1/12 9:39:49/

1、均值漂移算法原理

pyrMeanShiftFiltering算法结合了均值迁移(Mean Shift)算法和图像金字塔(Image Pyramid)的概念,用于图像分割和平滑处理。以下是该算法的详细原理:

1.1 、均值迁移(Mean Shift)算法原理

  • 目标:均值迁移算法的目标是找到图像中颜色分布的峰值,这些峰值代表了图像中的不同区域或对象。
  • 特征空间:对于一幅彩色图像,每个像素点可以表示为一个五维向量(x, y, r, g, b),其中(x, y)是像素的位置坐标,(r, g, b)是像素的颜色值。
  • 迭代过程
  1. 以某个像素点P为圆心,构建一个空间球体(在特征空间中),球体的半径由空间域半径sr和颜色域半径sp决定。
  2. 在这个空间球体内,计算所有点相对于中心点P的色彩向量之和,然后移动中心点P到这个向量的终点,作为新的中心点P1。
  3. 重复上述步骤,直到中心点Pn不再移动,满足迭代终止条件(如达到最大迭代次数或迭代精度)。
  • 结果:经过迭代,收敛到同一点的起始点被归为一类,这些点的像素值被更新为该类中心点的像素值。这样,图像中的相似区域就被平滑处理,同时保留了边缘等差异较大的特征。

1.2 图像金字塔(Image Pyramid)原理

图像金字塔是一种多分辨率图像表示方法,通过将图像在不同尺度下进行下采样,生成一系列分辨率逐渐降低的图像。在pyrMeanShiftFiltering算法中,图像金字塔用于在不同尺度上对图像进行均值迁移滤波,从而增强算法对图像细节的捕捉能力。

2、 pyrMeanShiftFiltering算法实现

函数原型

dst = cv2.pyrMeanShiftFiltering(src, sp, sr[, dst[, maxLevel[, termcrit]]])

参数说明

src(输入图像):

  • 类型:8位、3通道图像。
  • 说明:这是待处理的源图像。

dst(输出图像):

  • 类型:与源图像格式和大小相同的图像。
  • 说明:这是处理后的输出图像。

sp(空间窗口半径):

  • 类型:double。
  • 说明:定义了像素在物理空间中的邻域范围。该值越大,表示考虑的邻域范围越广。

sr(颜色窗口半径):

  • 类型:double。
  • 说明:定义了像素在颜色空间中的邻域范围。该值越大,表示在颜色空间中考虑的相似颜色范围越广。

maxLevel(最大金字塔层级):

  • 类型:int。
  • 默认值:1。
  • 说明:用于控制图像金字塔的层级数。当maxLevel > 0时,会构建高斯金字塔,并在最小层上首先运行均值迁移过程。之后,结果会传播到较大的层,并且仅在金字塔较低分辨率层的颜色与当前层的颜色相差超过sr的像素上再次运行迭代。

termcrit(终止准则):

  • 类型:TermCriteria。
  • 默认值:TermCriteria(TermCriteria::MAX_ITER+TermCriteria::EPS,5,1)。
  • 说明:定义了何时停止均值迁移迭代的条件。可以是迭代次数满足终止条件、迭代目标与中心点偏差满足终止条件,或者两者的结合。

处理过程

  • 首先,在最高尺度的图像上应用均值迁移滤波。
  • 然后,将滤波后的图像下采样到下一尺度,并重复应用均值迁移滤波。
    这个过程一直持续到达到指定的金字塔层次max_level。
  • 输出:算法输出一张经过平滑处理和分割的图像。在这张图像中,相似颜色的区域被平滑处理,不同区域之间的边缘被保留下来。

效果调试
pyrMeanShiftFiltering算法在图像分割、平滑处理、特征提取等方面有广泛应用。通过调整算法参数(如sp、sr、max_level等),可以获得不同的处理效果。例如,较大的sp和sr值会导致更强烈的平滑效果,而较小的值则能保留更多的图像细节。

3、基于均值漂移的水彩画特效

import cv2 as cv
import numpy as npif __name__ == '__main__':#读取原始图像image = cv.imread('oldman.jpg', cv.IMREAD_COLOR)#均值漂移分割meanshift = cv.pyrMeanShiftFiltering(image, 16, 64, 2)#高斯平滑gaussian_filter = cv.GaussianBlur(meanshift, (3, 3), 0.8)#中值滤波result = cv.medianBlur(gaussian_filter, 3)ada_result = np.concatenate((image, result), axis=1)cv.imwrite('wash-painting.jpeg', ada_result)cv.waitKey()

在这里插入图片描述


http://www.ppmy.cn/embedded/153258.html

相关文章

React面试常见题目

在前端面试中,React 是一个非常重要的知识点,面试题目往往涵盖基础概念和高级应用。以下是常见的面试题目以及进阶题目的整理和详解。 一、基础题目 1. React 的核心概念 问:React 的生命周期有哪些?如何在函数组件中使用&#…

vue实现淘宝web端,装饰淘宝店铺APP,以及后端设计成能快速响应前端APP

一、前端实现 实现一个类似于淘宝店铺的装饰应用(APP)是一个复杂的任务,涉及到前端界面设计、拖放功能、模块化组件、数据管理等多个方面。为了简化这个过程,我们可以创建一个基本的 Vue 3 应用,允许用户通过拖放来添…

彻底学会Gradle插件版本和Gradle版本及对应关系

看完这篇,保你彻底学会Gradle插件版本和Gradle版本及对应关系,超详细超全的对应关系表 需要知道Gradle插件版本和Gradle版本的对应关系,其实就是需要知道Gradle插件版本对应所需的gradle最低版本,详细对应关系如下表格&#xff0…

芯片详细讲解,从而区分CPU、MPU、DSP、GPU、FPGA、MCU、SOC、ECU

目录 芯片的概念结构 芯片的派系划分 通用芯片(CPU,MPU,GPU,DSP) 定制芯片(FPGA,ASIC) 芯片之上的集成(MCU,SOC,ECU) 软硬件的匹…

一分钟学会文心一言API如何接入,文心一言API接入教程

一、前期准备 注册百度智能云账号: 前往百度智能云官网注册一个账号。这是接入文心一言API的基础。 了解API接口: 在百度智能云开放平台中,找到文心一言API的详情页,了解提供的API接口类型(如云端API、移动端API、离线…

基于RK3568/RK3588大车360度环视影像主动安全行车辅助系统解决方案,支持ADAS/DMS

产品设计初衷 HS-P2-2D是一款针对大车盲区开发的360度全景影像 安全行车辅助系统,通过车身四周安装的超广角像机,经算法合成全景鸟瞰图,通过鸟瞰图,司机非常清楚的看清楚车辆四周情况,大大降低盲区引发的交通事故。 产…

不同音频振幅dBFS计算方法

1. 振幅的基本概念 振幅是描述音频信号强度的一个重要参数。它通常表示为信号的幅度值,幅度越大,声音听起来就越响。为了更好地理解和处理音频信号,通常会将振幅转换为分贝(dB)单位。分贝是一个对数单位,能…

C语言二级考试

你必须知道的 二级考试不是编写程序,或者说不只是编程的考核,它还会考核计算机C语言相关语言还有内涵等基础知识,比较全面综合(说人话,要看最新考纲具备一定的基础知识) 考试时间 120 分钟 分值 100 分&…