图像文件转换实验:BMPtoYUV

news/2025/2/1 15:52:30/

一、实验目的

1.理解图像文件的基本组成。

2.掌握结构体作为复杂数据对象的用法。进一步熟悉由问题到程序的解决方案,并掌握编程细节:如内存分配、倒序读写、字节序、文件读写过程等。

二、实验原理

BMP文件的组成结构

BMP(全称Bitmap)是Windows操作系统中的标准图像文件格式,可以分成两类:设备相关位图(DDB)和设备无关位图(DIB),使用广泛。它采用位映射存储格式,除了图像深度可选以外,在绝大多数应用中不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit、16bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。

典型的BMP图像文件由四部分组成:
(1)位图头文件数据结构,它包含BMP图像文件的类型、显示内容等信息;
(2)位图信息数据结构,它包含有BMP图像的宽、高、压缩方法,以及定义颜色等信
息;
(3)调色板,这个部分是可选的,有些位图需要调色板,有些位图,比如真彩色图(24
位的BMP)就不需要调色板;
(4)位图数据,这部分的内容根据BMP位图使用的位数不同而不同,在24位图中直接
使用RGB,而其他的小于24位的使用调色板中颜色索引值。

相应的数据结构可表示如下:

位图文件头(定义BMP文件结构体)主要包括:

typedef struct tagBITMAPFILEHEADER 
{2WORD bfType; /* 说明文件的类型*/DWORD bfSize;/* 说明文件的大小,用字节为单位*/WORD bfReserved1; /* 保留,设置为0 */WORD bfReserved2; /* 保留,设置为0 */DWORD bfOffBits; /* 说明从BITMAPFILEHEADER结构开始到实际的图像数据之间的字节偏移量*/
} BITMAPFILEHEADER;

位图信息头主要包括:

typedef struct tagBITMAPINFOHEADER
{DWORD biSize;			//说明结构体所需字节数LONG biWidth;			//以像素为单位说明图像的宽度LONG biHeight;		//以像素为单位说明图像的高度WORD biPlanes;		//说明位面数,必须为1WORD biBitCount;		//说明位数像素,1表示黑白图、 4表示16色图、//8表示256色图、24表示真彩色图DWORD biCompression;	//说明图像是否压缩及压缩类型BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDSDWORD biSizeImage;		//以字节为单位说明图像大小,必须是4的整数倍LONG biXPelsPerMeter;	//目标设备的水平分辨率,像素/米LONG biYPelsPerMeter;	//目标设备的垂直分辨率,像素/米DWORD biClrUsed;		//说明图像实际用到的颜色数,如果为0则颜色数为2的 biBitCount次方DWORD biClrImportant;	//说明对图像显示有重要影响的颜色索引的数目,如果是0,表示都重要
} BITMAPINFOHEADER;

调色板

typedef struct tagRGBQUAD 
{BYTE rgbBlue;	//指定蓝色分量BYTE rgbGreen;	//指定绿色分量BYTE rgbRed;		//指定红色分量BYTE rgbReserved;//指定保留,指定为0
} RGBQUAD
调色板实际上是一个数组,它所包含的元素与位图所具有的颜色数相同,决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。真彩色无调色板部分。

图像数据字节阵列

    紧跟在调色板之后的是图像数据字节阵列。对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值(逻辑色)。对于真彩色图,图像数据就是实际的R、G、B值。图像的每一扫描行由表示图像像素的连续的字节组成,每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。规定每一扫描行的字节数必须是4的整倍数,也就是DWORD对齐的。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的像素,而最后一个字节表示位图右上角的像素。

字节序

不同的计算机系统采用不同的字节序存储数据,同样一个4字节的32位整数,在内存中存储的方式不同。字节序分为小尾字节序(Little Endian)和大尾字节序(Big Endian)。Intel处理器大多数使用小尾字节序,Motorola处理器大多数使用大尾(Big Endian)字节序。

小尾就是低位字节排放在内存的低端,高位字节排放在内存的高端,即所谓的“低位在前,高位在后”。大尾就是高位字节排放在内存的低端,低位字节排放在内存的高端,即所谓的“高位在前,低位在后”。TCP/IP各层协议将字节序定义为大尾,因此TCP/IP协议中使用的字节序通常称之为网络字节序。

在实现BMP文件头信息的写入和读出时,需要注意整数保存时的字节序。例如:文件大小是以Intel序保存的。在编程前先用二进制打开方式观察BMP文件各个部分的数据存储格式。

实验流程

(1)在图像处理软件中自行生成多个BMP文件,至少含5个不同的场景画面,要求带含有班级、学号后四位和本人姓名(缩写或昵称均可)的logo。(基本要求为24bit的BMP,进阶要求为支持小于24bit的BMP)
(2)编写将第一步所生成的多个BMP文件转化为YUV文件,要求可在命令行中设置每个画面出现的帧数。最后形成的YUV文件应至少包含200帧。重点掌握函数定义、缓冲区分配、倒序读写、结构体的操作。
(3)对整个程序进行调试,并将生成的YUV文件用播放软件观看,验证是否正确。

实验过程

选用图片如下:
本来素材没有这么潦草的,但是出了一点意料之外的问题,临时更改了素材,于是就很简陋了。。。
在指令行键入每帧图片想持续的帧数,我这里统一设为10帧,共计50帧。
在这里插入图片描述
运行!
在这里插入图片描述
得到yuv序列,用专门的播放器查看:

yuv

实验代码

代码由三部分构成,一个头文件和两个源文件

头文件 head.h

#ifndef RGB2YUV_H_
#define RGB2YUV_H_
int rgb2yuv(int x_dim, int y_dim, void* bmp, void* y_out, void* u_out, void* v_out, int flip);
void InitLookupTable();
#endif

源文件 rgb2yuv.cpp

#include "stdlib.h"
#include "head.h"static float RGBYUV02990[256], RGBYUV05870[256], RGBYUV01140[256];
static float RGBYUV01684[256], RGBYUV03316[256];
static float RGBYUV04187[256], RGBYUV00813[256];int rgb2yuv(int x_dim, int y_dim, void* bmp, void* y_out, void* u_out, void* v_out, int flip)
{static int init_done = 0;long i, j, size;unsigned char* r, * g, * b;unsigned char* y, * u, * v;unsigned char* pu1, * pu2, * pv1, * pv2, * psu, * psv;unsigned char* y_buffer, * u_buffer, * v_buffer;unsigned char* sub_u_buf, * sub_v_buf;if (init_done == 0){InitLookupTable();init_done = 1;}// 检查x_dim和y_dim是否能被2整除if ((x_dim % 2) || (y_dim % 2))return 1;size = x_dim * y_dim;// 分配内存y_buffer = (unsigned char*)y_out;sub_u_buf = (unsigned char*)u_out;sub_v_buf = (unsigned char*)v_out;u_buffer = (unsigned char*)malloc(size * sizeof(unsigned char));v_buffer = (unsigned char*)malloc(size * sizeof(unsigned char));if (!(u_buffer && v_buffer)){if (u_buffer) free(u_buffer);if (v_buffer) free(v_buffer);return 2;}b = (unsigned char*)bmp;y = y_buffer;u = u_buffer;v = v_buffer;// RGB to YUVif (!flip) {for (j = 0; j < y_dim; j++){//从最后一行开始y = y_buffer + (y_dim - j - 1) * x_dim;u = u_buffer + (y_dim - j - 1) * x_dim;v = v_buffer + (y_dim - j - 1) * x_dim;for (i = 0; i < x_dim; i++){g = b + 1;r = b + 2;*y = (unsigned char)(RGBYUV02990[*r] + RGBYUV05870[*g] + RGBYUV01140[*b]);*u = (unsigned char)(-RGBYUV01684[*r] - RGBYUV03316[*g] + (*b) / 2 + 128);*v = (unsigned char)((*r) / 2 - RGBYUV04187[*g] - RGBYUV00813[*b] + 128);b += 3;y++;u++;v++;}}}else {for (i = 0; i < size; i++){g = b + 1;r = b + 2;*y = (unsigned char)(RGBYUV02990[*r] + RGBYUV05870[*g] + RGBYUV01140[*b]);*u = (unsigned char)(-RGBYUV01684[*r] - RGBYUV03316[*g] + (*b) / 2 + 128);*v = (unsigned char)((*r) / 2 - RGBYUV04187[*g] - RGBYUV00813[*b] + 128);b += 3;y++;u++;v++;}}// subsample UV (下采样)for (j = 0; j < y_dim / 2; j++){psu = sub_u_buf + j * x_dim / 2;  //每行psv = sub_v_buf + j * x_dim / 2;pu1 = u_buffer + 2 * j * x_dim;         //奇数行pu2 = u_buffer + (2 * j + 1) * x_dim;   //偶数行pv1 = v_buffer + 2 * j * x_dim;         //奇数行pv2 = v_buffer + (2 * j + 1) * x_dim;   //偶数行for (i = 0; i < x_dim / 2; i++){*psu = (*pu1 + *(pu1 + 1) + *pu2 + *(pu2 + 1)) / 4;*psv = (*pv1 + *(pv1 + 1) + *pv2 + *(pv2 + 1)) / 4;psu++;psv++;pu1 += 2;pu2 += 2;pv1 += 2;pv2 += 2;}}free(u_buffer);free(v_buffer);return 0;
}void InitLookupTable() //查找表
{int i;for (i = 0; i < 256; i++) RGBYUV02990[i] = (float)0.2990 * i;for (i = 0; i < 256; i++) RGBYUV05870[i] = (float)0.5870 * i;for (i = 0; i < 256; i++) RGBYUV01140[i] = (float)0.1140 * i;for (i = 0; i < 256; i++) RGBYUV01684[i] = (float)0.1684 * i;for (i = 0; i < 256; i++) RGBYUV03316[i] = (float)0.3316 * i;for (i = 0; i < 256; i++) RGBYUV04187[i] = (float)0.4187 * i;for (i = 0; i < 256; i++) RGBYUV00813[i] = (float)0.0813 * i;
}

源文件main.cpp

#include <stdio.h>
#include <iostream>
#include <windows.h>
#include "head.h"BITMAPFILEHEADER FILE_header;
BITMAPINFOHEADER Info_header;
using namespace std;static float RGBYUV02990[256], RGBYUV05870[256], RGBYUV01140[256];
static float RGBYUV01684[256], RGBYUV03316[256];
static float RGBYUV04187[256], RGBYUV00813[256];int main(int argc, char* argv[])
{int width, height;int picNum[5] = { 0 };//在命令行中获取每个画面出现的帧数for (int i = 0; i < 5; i++) {picNum[i] = atoi(argv[i + 1]);}char bmpFileName[][10] = { "pic1.bmp","pic2.bmp" ,"pic3.bmp" ,"pic4.bmp" ,"pic5.bmp" };char yuvFileName[] = "new1.yuv";int videoFramesWritten = 0;  //总帧数FILE* bmpFile = NULL, * yuvFile = NULL;unsigned char* bmpBuf = NULL, * yBuf = NULL, * uBuf = NULL, * vBuf = NULL;//打开(新建)yuv文件errno_t err;if ((err = fopen_s(&yuvFile, yuvFileName, "wb")) != 0) {cout << "FAIL TO OPEN!";exit(1);}//打开bmp文件for (int i = 0; i < 5; i++) {if ((err = fopen_s(&bmpFile, bmpFileName[i], "rb")) != 0) {cout << "FAIL TO OPEN BMP FILE!";exit(1);}//读取当前图像的文件头和信息头BITMAPFILEHEADER fileHeader;BITMAPINFOHEADER infoHeader;if (fread(&fileHeader, sizeof(BITMAPFILEHEADER), 1, bmpFile) != 1) {cout << "read file header error!";exit(0);}//判断是否为bmp格式if (fileHeader.bfType != 0x4D42) {cout << "Not bmp file!";exit(0);}if (fread(&infoHeader, sizeof(BITMAPINFOHEADER), 1, bmpFile) != 1) {cout << "read info header error!";exit(0);}//处理图像的宽和高width = infoHeader.biWidth;height = infoHeader.biHeight;//为变量开辟内存空间bmpBuf = (unsigned char*)malloc(width * height * 3);//每个像素三字节//YUV采用4:2:0取样格式yBuf = (unsigned char*)malloc(width * height);uBuf = (unsigned char*)malloc((width * height) / 4);vBuf = (unsigned char*)malloc((width * height) / 4);if (bmpBuf == NULL || yBuf == NULL || uBuf == NULL || vBuf == NULL) {cout << "no enough memory\n";exit(1);}//读取图像数据fread(bmpBuf, sizeof(unsigned char), width * height * 3, bmpFile);//转换图像类型rgb2yuv(width, height, bmpBuf, yBuf, uBuf, vBuf,0);//防溢出及保护电平for (int i = 0; i < width * height; i++) {if (yBuf[i] < 16)yBuf[i] = 16;if (yBuf[i] > 235)yBuf[i] = 235;}for (int i = 0; i < width * height / 4; i++) {if (uBuf[i] < 16) uBuf[i] = 16;if (uBuf[i] > 240) uBuf[i] = 240;if (vBuf[i] < 16) vBuf[i] = 16;if (vBuf[i] > 240) vBuf[i] = 240;}int num = picNum[i];//每张图片重复存储for (int i = 0; i < num; i++) {fwrite(yBuf, 1, width * height, yuvFile);fwrite(uBuf, 1, (width * height) / 4, yuvFile);fwrite(vBuf, 1, (width * height) / 4, yuvFile);++videoFramesWritten;}free(bmpBuf);free(yBuf);free(uBuf);free(vBuf);}printf("\n%u %ux%u video frames written\n", videoFramesWritten, width, height);fclose(bmpFile);fclose(yuvFile);return(0);
}

实验中的问题:

本次实验中出现问题并不大,其过程堪称闹剧,在此写出,博君一笑。
在代码写好后,一直无法成功运行,自动跳出并输出no enough memory
在这里插入图片描述
于是开始调试,发现图片高度读取竟然是复数?!?!?
在这里插入图片描述
于是请教大佬,得知负数也有意义,即从上向下扫描写入(此时我还以为是我代码有问题),于是重新编写,新的代码可以成功运行了,但输出yuv。。。
在这里插入图片描述
于是以为是调色盘的问题,去掉调色盘,改用真彩图像
在这里插入图片描述
真“彩”啊,只有彩了啊啊啊啊啊
看到有人问彩色超限的问题,于是添加限制,结果变成全黑。。。
无奈之下,把图片发给同学,希望直接拿到成品yuv水过这篇,结果。。。
在这里插入图片描述
在这里插入图片描述
。。。居然是因为我用微信截图保存的源图片的问题吗???
于是我换了源图片(就是上边的五个,用windows画图粗略制作),成功了。。。
查找资料,发现网上并没有对这方面的解释,只能认为为了使截屏画面更加清晰什么的,微信保存的bmp文件数据写入格式与通常的bmp不同,所以对通常bmp解析后的代码不能对截图文件生效。
累了,毁灭吧。


http://www.ppmy.cn/news/807481.html

相关文章

BMP序列转YUV文件

目录 一、基本原理 1.BMP文件格式 2.文件组成 位图文件头&#xff1a; 位图信息头&#xff1a; 调色板&#xff1a; 位图数据&#xff1a; 二、实验思路 三、代码实现 修改命令行参数 1.rgbtoyuv rgb2yuv.h main函数 rgb2yuv.cpp 2.bmptoyuv bmp2yuv.h main函数…

【数据压缩】实验1:将BMP文件转换为YUV文件

BMP文件简介 位图文件(Bitmap-File&#xff0c;BMP)格式是Windows采用的图像文件存储格式&#xff0c;其位图文件默认的文件扩展名是bmp或者dib。BMP文件的图像深度可选1bit、4bit、8bit、16bit及24bit。BMP文件存储数据时&#xff0c;图像的扫描方式是按从左到右、从下到上的…

babylonjs

如何引入babylonjs到项目中 babylonjs中文文档 https://doc.cnbabylon.com/3-0-how-to-get-babylon-js/ “babylonjs/core”: “^5.0.0”, BabylonOne.vue <template> <div class"mainbox " touchmove.prevent><div :class"tipsBox?tipsBox…

半监督3D医学图像分割(三):URPC

Efficient Semi-supervised Gross Target Volume of Nasopharyngeal Carcinoma Segmentation via Uncertainty Rectified Pyramid Consistency 深度学习归根结底是数据驱动的&#xff0c;模型训练的好坏依赖于数据集。在医学图像分割领域&#xff0c;即使是像nn-UNet那样强大的…

[数据压缩]bmp序列转yuv文件

目录 bmp文件分析 bmp转yuv思路 代码实现 结果展示 bmp文件分析 bmp简介 BMP是英文Bitmap&#xff08;位图&#xff09;的简写&#xff0c;是Windows采用的图像文件存储格式。在Windows环境下运行的所有图像处理软件都支持这种格式。在Windows环境下运行的所有图像处理软件…

(新SOTA)UNETR++:轻量级的、高效、准确的共享权重的3D医学图像分割

&#xff08;新SOTA&#xff09;UNETR&#xff1a;轻量级的、高效、准确的共享权重的3D医学图像分割 0 Abstract 由于Transformer模型的成功&#xff0c;最近的工作研究了它们在3D医学分割任务中的适用性。在Transformer模型中&#xff0c;与基于局部卷积的设计相比&#xff…

A Survey on Deep Learning Techniques for Stereo-based Depth Estimation论文阅读

第一次校正&#xff0c;改正了一些错误和生硬的翻译&#xff08;像机器翻译一样&#xff09;。一定会有一些笔误、翻译不准确甚至错误的地方。还望批评指正。 1. 摘要 估计RGB图片的深度一直以来都是棘手的问题&#xff0c;计算机视觉、图形学、机器学习社区在此耕耘了数十年…

RGB与YUV的互相转换

RGB与YUV的互相转换 一、实验目的&#xff1a;完成彩色空间的互相转换&#xff0c;即将.yuv图片转换为.rgb图片&#xff0c;将.rgb图片转换为.yuv文件。 先调试老师给出的.rgb文件转换至.yuv文件代码&#xff0c;理清思路&#xff0c;再写出.yuv文件转换至.rgb文件代码。 do…