Opencv 图像读取与保存问题

server/2025/4/1 7:02:54/

本文仅对 Opencv图像读取与保存进行阐述,重在探讨图像读取与保存过程中应注意的细节问题。

1 图像读取

首先看一下,imread函数的声明:

// C++: Mat based
Mat imread(const string& filename, int flags=1 );// C: IplImage based
IplImage* cvLoadImage(const char* filename, int iscolor=CV_LOAD_IMAGE_COLOR );// C: CvMat based
CvMat* cvLoadImageM(const char* filename, int iscolor=CV_LOAD_IMAGE_COLOR );

此处,就不列出python的函数声明。随着2.x和3.x版本号不断更新, Opencv的C++版本号数据结构和C版本号有较大差异,前者降低了指针的大量使用。使用方法更加便捷,因此建议多使用前者。以C++版本号函数进行分析,形參列表包含:

  • filename : 待载入图像(包含:文件路径和文件名称。图像在project默认路径下的可省略文件路径);
  • flags : 标志符,指定图像载入颜色类型。默认值为1:

    • IMREAD_UNCHANGED / CV_LOAD_IMAGE_UNCHANGED :不加改变的载入原图。
    • IMREAD_GRAYSCALE / CV_LOAD_IMAGE_GRAYSCALE :图像转为灰度图(GRAY,1通道)。

    • IMREAD_COLOR / CV_LOAD_IMAGE_COLOR :图像转为彩色图(BGR,3通道)。

    • IMREAD_ANYDEPTH / CV_LOAD_IMAGE_ANYDEPTH :不论什么位深度。假设载入的图像不是16-bit位图或者32-bit位图。则转化为8-bit位图。
    • IMREAD_ANYCOLOR / CV_LOAD_IMAGE_ANYCOLOR :不论什么彩色。单独使用的时候等价于 IMREAD_UNCHANGED / CV_LOAD_IMAGE_UNCHANGED 。
    • > 0 :返回3通道的彩色图,可是假设是4通道(RGBA)。当中Alpha须要保留的话,不建议这么使用。由于一旦这么使用。就会导致Alpha通道被剥离掉,此时建议使用负值。

    • = 0 :返回灰度图像。
    • < 0 :返回具有Alpha通道的图像。

假设你喜欢使用imread("file.jpg")缺省參数的形式载入图像。务必要留意你所载入后的图像可能已经不是你原本想要的图像了。

从 Opencv源代码枚举类型中也能够看到上述标识符含义:

// highgui.hpp
enum
{// 8bit, color or notIMREAD_UNCHANGED  =-1,// 8bit, grayIMREAD_GRAYSCALE  =0,// ?, colorIMREAD_COLOR      =1,// any depth, ?IMREAD_ANYDEPTH   =2,// ?, any colorIMREAD_ANYCOLOR   =4
};// highui_c.h
enum
{
/* 8bit, color or not */CV_LOAD_IMAGE_UNCHANGED  =-1,
/* 8bit, gray */CV_LOAD_IMAGE_GRAYSCALE  =0,
/* ?
, color */CV_LOAD_IMAGE_COLOR      =1,
/* any depth, ? */CV_LOAD_IMAGE_ANYDEPTH   =2,
/* ?, any color */CV_LOAD_IMAGE_ANYCOLOR   =4
};

Opencv已经支持眼下非常多图像格式,可是并不是所有。

主要包含:

  • Windows bitmaps    ->    *.bmp, *.dib (always supported)
  • JPEG files    ->    *.jpeg, *.jpg, *.jpe (see the Notes section)
  • JPEG 2000 files    ->    *.jp2,*.jpf,*.jpx (see the Notes section)
  • Portable Network Graphics    ->    *.png (see the Notes section)
  • WebP    ->    *.webp (see the Notes section)
  • Portable image format    ->    *.pbm, *.pgm, *.ppm (always supported)
  • Sun rasters    ->    *.sr, *.ras (always supported)
  • TIFF files    ->    *.tiff, *.tif (see the Notes section)

    Notes

    • 1 The function determines the type of an image by the content, not by the file extension.
    • 2 On Microsoft Windows* OS and MacOSX*, the codecs shipped with an OpenCV image (libjpeg, libpng, libtiff, and libjasper) are used by default. So, OpenCV can always read JPEGs, PNGs, and TIFFs. On MacOSX, there is also an option to use native MacOSX image readers. But beware that currently these native image loaders give images with different pixel values because of the color management embedded into MacOSX.
    • 3 On Linux*, BSD flavors and other Unix-like open-source operating systems, OpenCV looks for codecs supplied with an OS image. Install the relevant packages (do not forget the development files, for example, “libjpeg-dev”, in Debian* and Ubuntu*) to get the codec support or turn on the OPENCV_BUILD_3RDPARTY_LIBS flag in CMake.
    • 4 In the case of color images, the decoded images will have the channels stored in B G R order.

对于常见的支持4通道的图像格式来说, Opencv读取结果是有差异的:

// 1.tif, 1.jp2 and 1.png are color images with 4 channels: R, G, B, A
cv::Mat imageTif = cv::imread("E:\\1.tif"); // the default flags is 1
cv::Mat imageJp2 = cv::imread("E:\\1.jp2"); // the default flags is 1
cv::Mat imagePng = cv::imread("E:\\1.png"); // the default flags is 1
std::cout << imageTif.channels() << std::endl; // prints 3
std::cout << imageJp2.channels() << std::endl; // prints 3
std::cout << imagePng.channels() << std::endl; // prints 3cv::Mat imageTif2 = cv::imread("E:\\1.tif", -1); // flags = -1
cv::Mat imageJp22 = cv::imread("E:\\1.jp2", -1);
cv::Mat imagePng2 = cv::imread("E:\\1.png", -1);
std::cout << imageTif2.channels() << std::endl; // prints 3
std::cout << imageJp22.channels() << std::endl; // prints 3
std::cout << imagePng2.channels() << std::endl; // prints 4

由此可见,眼下 Opencv能够直接读取4通道图像并保留Alpha通道的貌似仅仅有PNG格式,对于非PNG格式数据,须要保留Alpha通道的应用,假设坚持使用 Opencv库,建议转格式吧~

2 图像存储

首先来看,imwrite函数的声明:

// c++: Mat based
bool imwrite(const string& filename, InputArray img, const vector<int>& params=vector<int>() );// C: CvMat and IplImage based
int cvSaveImage(const char* filename, const CvArr* image, const int* params=0 );

仍旧以C++版本号为例。其形參列表为:

  • filename:待保存图像名(包含:文件路径和文件名称,图像在project默认路径下的可省略文件路径);
  • img:待保存的图像对象。
  • params :特定图像存储编码參数设置。以相似pairs类型的方式。(paramId_1, paramValue_1)(paramId_2, paramValue_2)…,当中paramId_1就是标志符值。paramValue_1标识符值相应的兴许參数设置:
vector<int> compression_params;
compression_params.push_back(CV_IMWRITE_PNG_COMPRESSION); // paramId_1, png compression
compression_params.push_back(9);                          // paramValue_2, compression level is 9 

在 Opencv中。主要对JPEG,PNG和PXM的编码方式进行了特别声明:

// highgui.hpp
enum
{IMWRITE_JPEG_QUALITY =1,         // quality from 0 to 100, default value is 95. (The higher is the better)IMWRITE_PNG_COMPRESSION =16,     // compression level from 0 to 9, default value is 3. (A higher value means a smaller size and longer compression time. Default value is 3.)IMWRITE_PNG_STRATEGY =17,IMWRITE_PNG_BILEVEL =18,IMWRITE_PNG_STRATEGY_DEFAULT =0,IMWRITE_PNG_STRATEGY_FILTERED =1,IMWRITE_PNG_STRATEGY_HUFFMAN_ONLY =2,IMWRITE_PNG_STRATEGY_RLE =3,IMWRITE_PNG_STRATEGY_FIXED =4,IMWRITE_PXM_BINARY =32          // binary format flag: 0 or 1, default value is 1.
};// highui_c.h
enum
{CV_IMWRITE_JPEG_QUALITY =1,CV_IMWRITE_PNG_COMPRESSION =16,CV_IMWRITE_PNG_STRATEGY =17,CV_IMWRITE_PNG_BILEVEL =18,CV_IMWRITE_PNG_STRATEGY_DEFAULT =0,CV_IMWRITE_PNG_STRATEGY_FILTERED =1,CV_IMWRITE_PNG_STRATEGY_HUFFMAN_ONLY =2,CV_IMWRITE_PNG_STRATEGY_RLE =3,CV_IMWRITE_PNG_STRATEGY_FIXED =4,CV_IMWRITE_PXM_BINARY =32
};

上述的标识符含义,显而易见,就不累述。

值得强调的是,imwrite函数支持存储的图像类型是有限的仅仅包含:1。3,4通道的图像,可是对于不同的图像格式。也是有差异的:

  • 对于单通道8-bit位图(或者16-bit位图( CV_16U/CV_16UC1 的PNG,JPEG 2000 和TIFF))或者3通道(通道顺序为:B G R )的图像,imwrite函数是都支持的。

    对于格式,或者位深或者通道顺序与上面不一致的。能够使用函数Mat::convertTo()cvtColor()函数进行转换后,再保存。当然,也能够使用通用的方法利用FileStorageI/O操作。将图像存为XML或YAML格式。

  • 对于PNG图像,能够保存其Alpha通道,创建一个8-bit或者16-bit 4通道的位图(通道顺序为:B G R A )。假设是全透明的Alpha通道设置为0,反之不透明设置为255/65535。

对于多通道图像,假设想对其每一个通道单独进行保存,当然也是可行的。一方面自己能够依据图像的信息和图层信息写出相应的存储函数,还有一方面 Opencv也提供了专门的函数split能够将图像的每一个通道提取出保存到vector中:


Panda
PNG原图

cv::Mat img = imread( "C:\\Users\\Leo\\Desktop\\Panda.png", CV_LOAD_IMAGE_UNCHANGED );std::vector<cv::Mat> imageChannels;
cv::split( img, imageChannels );
cv::imwrite("E:\\0.jpg", imageChannels[0]);
cv::imwrite("E:\\1.jpg", imageChannels[1]);
cv::imwrite("E:\\2.jpg", imageChannels[2]);
cv::imwrite("E:\\3.jpg", imageChannels[3]);


B Panda0 G Panda1 R Panda2 A Panda3
通道分离保存结果

附上 Opencv文档源代码:

#include <vector>
#include <stdio.h>
#include <opencv2/opencv.hpp>using namespace cv;
using namespace std;void createAlphaMat(Mat &mat)
{CV_Assert(mat.channels() == 4);for (int i = 0; i < mat.rows; ++i) {for (int j = 0; j < mat.cols; ++j) {Vec4b& bgra = mat.at<Vec4b>(i, j);bgra[0] = UCHAR_MAX; // Bluebgra[1] = saturate_cast<uchar>((float (mat.cols - j)) / ((float)mat.cols) * UCHAR_MAX); // Greenbgra[2] = saturate_cast<uchar>((float (mat.rows - i)) / ((float)mat.rows) * UCHAR_MAX); // Redbgra[3] = saturate_cast<uchar>(0.5 * (bgra[1] + bgra[2])); // Alpha}}
}int main(int argv, char **argc)
{// Create mat with alpha channelMat mat(480, 640, CV_8UC4);createAlphaMat(mat);vector<int> compression_params;compression_params.push_back(CV_IMWRITE_PNG_COMPRESSION);compression_params.push_back(9);try {imwrite("alpha.png", mat, compression_params);}catch (runtime_error& ex) {fprintf(stderr, "Exception converting image to PNG format: %s\n", ex.what());return 1;}fprintf(stdout, "Saved PNG file with alpha data.\n");return 0;
}

执行结果为:


http://www.ppmy.cn/server/180174.html

相关文章

Java 开发中的 AI 黑科技:如何用 AI 工具自动生成 Spring Boot 项目脚手架?

在 Java 开发领域&#xff0c;搭建 Spring Boot 项目脚手架是一项耗时且繁琐的工作。传统方式下&#xff0c;开发者需要手动配置各种依赖、编写基础代码&#xff0c;过程中稍有疏忽就可能导致配置错误&#xff0c;影响开发进度。如今&#xff0c;随着 AI 技术的迅猛发展&#x…

计算机视觉的多模态模型:开启感知智能的新篇章

引言&#xff1a;从单模态到多模态的演进 在人工智能领域&#xff0c;计算机视觉长期以来主要关注单一视觉数据的处理与分析。然而&#xff0c;人类对世界的理解从来不是基于单一感官输入——我们同时通过视觉、听觉、触觉等多种感官来感知环境&#xff0c;大脑将这些信息融合…

Python项目-基于Python的网络爬虫与数据可视化系统

1. 项目简介 在当今数据驱动的时代&#xff0c;网络爬虫和数据可视化已成为获取、分析和展示信息的重要工具。本文将详细介绍如何使用Python构建一个完整的网络爬虫与数据可视化系统&#xff0c;该系统能够自动从互联网收集数据&#xff0c;进行处理分析&#xff0c;并通过直观…

03-SpringBoot3入门-配置文件(自定义配置及读取)

1、自定义配置 # 自定义配置 zbj:user:username: rootpassword: 123456# 自定义集合gfs:- a- b- c2、读取 1&#xff09;User类 package com.sgu.pojo;import lombok.Data; import org.springframework.boot.context.properties.ConfigurationProperties; import org.spring…

什么是泛目录站群?怎么做好无极泛目录站群

什么是泛目录站群&#xff1f; 泛目录站群是一种通过创建多个细分领域的小型网站&#xff08;目录站&#xff09;&#xff0c;围绕主站核心业务和长尾关键词布局&#xff0c;通过内容优化、内部链接和权重传递提升主站搜索引擎排名的 SEO 策略。与传统站群不同&#xff0c;泛目…

Linux 练习二 LVS的NAT模式

作业 要求&#xff1a;使用LVS的 NAT 模式实现 3 台 RS 的轮询访问。IP地址和主机自己规划。 节点规划 主机角色系统网络IPclientclientredhat 9.5仅主机192.168.60.100/24lvslvsredhat 9.5仅主机 NAT192.168.60.200/24 VIP 192.168.23.8/24 DIPnginxrs1redhat 9.5NAT192.16…

TCP/IP三次握手的过程,为什么要3次?

一&#xff1a;过程 第一次&#xff08;SYN&#xff09;&#xff1a; 客户端发送一个带有SYN标志的TCP报文段给服务器&#xff0c;设置SYN1&#xff0c;并携带初始序列号Seqx&#xff08;随机值&#xff09;&#xff0c;进入SYN_SENT状态。等待服务器相应。 第二次&#xff08…

Nginx RTMP DASH 模块分析 (ngx_rtmp_dash_module.c)

ngx_rtmp_dash_module.c实现了一个 Nginx RTMP 模块&#xff0c;主要功能是支持通过 DASH&#xff08;动态自适应流媒体&#xff09;协议进行流媒体发布。DASH&#xff08;Dynamic Adaptive Streaming over HTTP&#xff09;是一种流行的视频流协议&#xff0c;它允许根据网络状…