前言
工作中遇到需要通过OpenCV找到图片主体体积占图片百分比的比例,这里做一个问题解决思路的记录。该方面新手小白,有不对的地方可以评论指出哈 。
重要API
Sobel算法
Sobel 计算参考文章
索贝尔算子是计算机视觉领域的一种重要处理方法。
主要用于获得数字图像的一阶梯度,常见的应用和物理意义是边缘检测。
索贝尔算子是把图像中每个像素的上下左右四领域的灰度值加权差,在边缘处达到极值从而检测边缘。在技术上,它是一离散性差分算子,用来运算图像亮度函数的梯度之近似值。在图像的任何一点使用此算子,将会产生对应的梯度矢量或是其法矢量。索贝尔算子不但产生较好的检测效果,而且对噪声具有平滑抑制作用,但是得到的边缘较粗,且可能出现伪边缘。
该算子包含两组3x3的矩阵,分别为横向及纵向,将之与图像作平面卷积,即可分别得出横向及纵向的亮度差分近似值。如果以A代表原始图像,Gx及Gy分别代表经横向及纵向边缘检测的图像,其公式如下:
图像的每一个像素的横向及纵向梯度近似值可用以下的公式结合,来计算梯度的大小。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nJRhDdGQ-1674892594274)(https://upload-images.jianshu.io/upload_images/6188347-f1dde384106a4b75.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/124)]
然后可用以下公式计算梯度方向。
在以上例子中,如果以上的角度θ等于零,即代表图像该处拥有纵向边缘,左方较右方暗 【引用:百度百科】
//src : 输入图像 dst: 输出图像
//ddepth: 输出图像的深度(可以理解为数据类型),-1表示与原图像相同的深度
//dx: dy: 当组合为dx=1,dy=0时求x方向的一阶导数,当组合为dx=0,dy=1时求y方向的一阶导数
//ksize: (可选参数)Sobel算子的大小,必须是1,3,5或者7,默认为3。
//scale: 对导数计算结果进行缩放的缩放因子,默认系数为1,不进行缩放
//delta: 偏值,在计算结果中加上偏值。
//borderType: 像素外推法选择标志。默认参数为BORDER_DEFAULT,表示不包含边界值倒序填充。
public static void Sobel(Mat src, Mat dst, int ddepth, int dx, int dy, int ksize, double scale, double delta, int borderType)
- 注意点:
-
图像深度是指存储每个像素值所用的位数,例如cv2.CV_8U,指的是8位无符号数,取值范围为0~255,超出范围则会被截断(截断指的是,当数值大于255保留为255,当数值小于0保留为0,其余不变)。
具体还有:CV_16S(16位无符号数),CV_16U(16位有符号数),CV_32F(32位浮点数),CV_64F(64位浮点数)
当ddepth 输出图像深度采用CV_8U,由于Sobel算子在计算X方向梯度时,如果某像素点右侧像素值大于左侧像素值,则梯度大小为正保留,相反梯度大小为负被截断,梯度大小保存为0。这里可以使用 CV_32F 防止数据存在负数情况。 -
在我们使用CV_32F数据类型求出XY阶后,需要配合使用函数convertScaleAbs()将图像深度为CV_64F的梯度图像重新转化为CV_8U,这是由于函数cv2.imshow()的默认显示为8位无符号数,即[0,255]。
具体思路
第一步,使用OpenCV的 Sobel算子来计算x,y方向上的梯度,在x方向上减去y方向上的梯度,通过这个减法,我们会留下有高水平梯度和低垂直梯度的图像区域。
Mat gradX = new Mat();Mat gradY = new Mat();Mat binary = new Mat();//求X Y 阶 转换为32位浮点数个数Imgproc.Sobel(grayImage, gradX, CvType.CV_32F, 1, 0, -1);Imgproc.Sobel(grayImage, gradY, CvType.CV_32F, 0, 1, -1);//相减Core.subtract(gradX, gradY, binary);//转换数据格式CV_8UCore.convertScaleAbs(binary, binary);
以上步骤我们可以得到一个带有很多噪点的边界图,为了剔除掉那些噪点对于主体的判断,我们需要使用 blur 方法 和黑白两极化对图片进行处理
第二步,使用低通滤泼器平滑图像(9 x 9内核),这将有助于平滑图像中的高频噪声。低通滤波器的目标是降低图像的变化率。如将每个像素替换为该像素周围像素的均值。这样就可以平滑并替代那些强度变化明显的区域。
//去噪
Imgproc.blur(binary, binary, new Size(9.0, 9.0));
//对模糊图像二值化。梯度图像中不大于90的任何像素都设置为0(黑色)。 否则,像素设置为255(白色)为第五步做准备工作
Imgproc.threshold(binary, binary, 90.0, 255.0, Imgproc.THRESH_BINARY | Imgproc.THRESH_OTSU);
第三步,通过上述方法可以得到一个黑白图,但是图片中可能会存在很多空白空隙, 我们要用白色填充这些空余,使得后面的程序更容易识别昆虫区域,这需要做一些形态学方面的操作。
//为形态学操作返回指定大小和形状的结构元素 用于形态学处理
Mat kernel = Imgproc.getStructuringElement(Imgproc.MORPH_RECT, new Size(25.0, 25.0));
// 使用腐蚀和膨胀作为基本操作来执行高级形态学转换
Imgproc.morphologyEx(binary,binary,Imgproc.MORPH_CLOSE,kernel);
第四步, 通过上述处理,可能还会存在一些 大的噪点, 可以通过形态学腐化和膨胀进行消除
Point p = new Point(-1.0, -1.0);
Imgproc.erode(binary, binary, ker, p, 4);
Imgproc.dilate(binary, binary, ker, p, 4);
第五步,通过 findContours()函数框选出主体的位置信息
List<MatOfPoint> contours = new ArrayList<>();
Mat hierarchy = new Mat();
// binary : 要检索的图片,必须是为二值图,即黑白的
//hierarchy : 结果返回值
Imgproc.findContours(binary,contours,hierarchy,Imgproc.RETR_EXTERNAL,Imgproc.CHAIN_APPROX_SIMPLE);
findContours 函数 最后两个参数,mode 和 method 单独拿出来列举下 不同的参数代表的含义
mode :
Imgproc.RETR_EXTERNAL 表示只检测外轮廓
Imgproc.RETR_LIST 检测的轮廓不建立等级关系
Imgproc.RETR_CCOMP 建立两个等级的轮廓,上面的一层为外边界,里面的一层为内孔的边界信息。如果内孔内还有一个连通物体,这个物体的边界也在顶层。
Imgproc.RETR_TREE 建立一个等级树结构的轮廓。
method :
Imgproc.CHAIN_APPROX_NONE 存储所有的轮廓点,相邻的两个点的像素位置差不超过1,即max(abs(x1-x2),abs(y2-y1))==1
Imgproc.CHAIN_APPROX_SIMPLE 压缩水平方向,垂直方向,对角线方向的元素,只保留该方向的终点坐标,例如一个矩形轮廓只需4个点来保存轮廓信息
结果都存储在 contours 数组中,我们可以使用他进行一些业务判断。
由于脱敏原因,这里没有demo图片,该篇文章 主要参考文章对我的帮助非常大,小白这里只是做一个开发记录,今天的这篇文章就到这里。
参考文章
识别颜色方块并提取轮廓
OpenCV自动检测图像中的物体并裁剪
Sobel()计算图像梯度的细节讲解
OpenCV API官网地址