一. 实验名称
图像文件的读写和转换(设计性实验)
二. 实验目的
1.理解图像文件的基本组成。
2.掌握结构体作为复杂数据对象的用法。进一步熟悉由问题到程序的解决方案,并掌握编程细节:如内存分配、倒序读写、字节序、文件读写过程等。
三.主要设备
安装VisualStudio软件或其他的个人计算机
四.实验相关知识(以BMP文件格式为例)
1.BMP文件的组成结构
BMP(全称Bitmap)是Windows操作系统中的标准图像文件格式,可以分成两类:设备相关位图(DDB)和设备无关位图(DIB),使用广泛。它采用位映射存储格式,除了图像深度可选以外,在绝大多数应用中不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit、16bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。
也就是说, 在 BMP 文件中首先存放的是图像的最后一行像素,最后才存储图像的第一行像素,但对于同一行的像素,则是按照先左边后右边的顺序存储的;另外一个需要关注的细节是:文件存储图像的每一行像素值时,如果存储该行像素值所占的字节数为 4 的倍数,则正常存储;否则,需要在后端补 0,凑足 4 的倍数
由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。典型的BMP图像文件由四部分组成:
(1)位图头文件数据结构,它包含BMP图像文件的类型、显示内容等信息;
(2)位图信息数据结构,它包含有BMP图像的宽、高、压缩方法,以及定义颜色等信息;
(3)调色板,这个部分是可选的,有些位图需要调色板,有些位图,比如真彩色图(24位的BMP)就不需要调色板;
(4)位图数据,这部分的内容根据BMP位图使用的位数不同而不同,在24位图中直接使用RGB,而其他的小于24位的使用调色板中颜色索引值。
相应的数据结构可表示如下:
(1)位图文件头BITMAPFILEHEADER
其定义如下:
typedef struct tagBITMAPFILEHEADER {WORD bfType; /* 说明文件的类型*/DWORD bfSize;/* 说明文件的大小,用字节为单位*/WORD bfReserved1; /* 保留,设置为0 */WORD bfReserved2; /* 保留,设置为0 */DWORD bfOffBits; /* 说明从BITMAPFILEHEADER结构开始到实际的图像数据之间的字节偏移量*/
}BITMAPFILEHEADER;
(2)位图信息头BITMAPINFOHEADER
其定义如下:
typedef struct tagBITMAPINFOHEADER {DWORD biSize; /* 说明结构体所需字节数*/LONG biWidth; /* 以像素为单位说明图像的宽度*/LONG biHeight; /* 以像素为单位说明图像的高速*/WORD biPlanes; /* 说明位面数,必须为1 */WORD biBitCount; /* 颜色深度,说明位数/像素,1、2、4、8、24 */DWORD biCompression; /* 说明图像是否压缩及压缩类型BI_RGB,BI_RLE8,BI_RLE4,BI_BITFIELDS */DWORD biSizeImage; /* 以字节为单位说明图像大小,必须是4的整数倍*/LONG biXPelsPerMeter; /*目标设备的水平分辨率,像素/米*/LONG biYPelsPerMeter; /*目标设备的垂直分辨率,像素/米*/DWORD biClrUsed; /* 说明图像实际用到的颜色数,如果为0,则颜色数为2的biBitCount次方*/DWORD biClrImportant; /*说明对图像显示有重要影响的颜色索引的数目,如果是0,表示都重要。*/
}BITMAPINFOHEADER;
(3)颜色表RGBQUAD
调色板实际上是一个数组,它所包含的元素与位图所具有的颜色数相同,决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。真彩色无调色板部分。
其定义如下:
typedef struct tagRGBQUAD {BYTE rgbBlue; /*指定蓝色分量*/BYTE rgbGreen; /*指定绿色分量*/BYTE rgbRed; /*指定红色分量*/BYTE rgbReserved; /*保留,指定为0*/
}RGBQUAD;
位图信息头和颜色表组成位图信息结构 BITMAPINFO, 其定义如下:
typedef struct tagBITMAPINFO{BITMAPINFOHEADER bmiHeader; // 位图信息头RGBQUAD bmiColors[1]; // 颜色表
} BITMAPINFO;
(4)实际的位图数据IMAGEDATA
紧跟在调色板之后的是图像数据字节阵列。对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值(逻辑色)。对于真彩色图,图像数据就是实际的R、G、B值。
- 对于 2 色位图, 1 位就可以表示该像素的颜色(一 般 0 表示黑,1 表示白),所以一个字节可以表示 8 个像素。
- 对于 16 色位图,4 位表示一个像素的颜色,所以一 个字节可以表示 2 个像素。
- 对于 256 色位图,1 个字节刚好可以表示 1 个像素。
- 对于真彩色图,3 个字节才能表示 1 个像素。
图像的每一扫描行由表示图像像素的连续的字节组成,每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。规定每一扫描行的字节数必须是4的整倍数,也就是DWORD对齐的。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的像素,而最后一个字节表示位图右上角的像素。
2.字节序
不同的计算机系统采用不同的字节序存储数据,同样一个4字节的32位整数,在内存中存储的方式不同。字节序分为小尾字节序(Little Endian)和大尾字节序(Big Endian)。Intel处理器大多数使用小尾字节序,Motorola处理器大多数使用大尾(Big Endian)字节序。
小尾就是低位字节排放在内存的低端,高位字节排放在内存的高端,即所谓的“低位在前,高位在后”。大尾就是高位字节排放在内存的低端,低位字节排放在内存的高端,即所谓的“高位在前,低位在后”。TCP/IP各层协议将字节序定义为大尾,因此TCP/IP协议中使用的字节序通常称之为网络字节序。
在实现BMP文件头信息的写入和读出时,需要注意整数保存时的字节序。例如:文件大小是以Intel序保存的。在编程前先用二进制打开方式观察BMP文件各个部分的数据存储格式。
五.实验步骤:
1. 准备5张24位bmp格式的图片
2. BMP序列转YUV文件
编写将第一步所生成的多个BMP文件转化为YUV文件,要求可在命令行中设置每个画面出现的帧数。最后形成的YUV文件应至少包含200帧。重点掌握函数定义、缓冲区分配、倒序读写、结构体的操作。
(1)程序初始化(打开两个文件、定义变量和缓冲区等)
int i = 0, k = 0;const char* bmp_name[5] = { 0 }; //存放bmp图片名bmp_name[0] = argv[1];bmp_name[1] = argv[2];bmp_name[2] = argv[3];bmp_name[3] = argv[4];bmp_name[4] = argv[5];FILE* yuvFile = fopen("out_video.yuv", "wb");FILE* bmpfile = NULL;BITMAPFILEHEADER File_header; // 文件头 BITMAPINFOHEADER Info_header; // 信息头 int frame_width, frame_height;
(2)读取BMP文件,抽取或生成RGB数据写入缓冲区
FILE* fp = fopen(bmp_name[k], "rb");//判断文件是否能打开if (fp == NULL){printf("can't find bmpfilie");exit(0);}//读取文件头if (fread(&File_header, sizeof(BITMAPFILEHEADER), 1, fp) != 1){cout << sizeof(BITMAPFILEHEADER) << endl;printf("read file header error!");exit(0);}// 位图文件头,判断是否为BMP文件 if (File_header.bfType != 0x4D42){printf("Not bmp file!");exit(0);}else{printf("this is a bmp file");}// 位图信息头,从中读取图片的宽、高、位数等信息 if (fread(&Info_header, sizeof(BITMAPINFOHEADER), 1, fp) != 1){printf("read info header error!");exit(0);}frame_width = Info_header.biWidth;frame_height = Info_header.biHeight;printf("\nThis is a %d bits image!\n", Info_header.biBitCount);printf("bmp size: \t%d X %d\n", Info_header.biWidth, Info_header.biHeight);printf("\n");u_int8_t* rgbBuf = NULL;u_int8_t* yBuf = NULL;u_int8_t* uBuf = NULL;u_int8_t* vBuf = NULL;yBuf = (u_int8_t*)malloc(frame_width * frame_height);uBuf = (u_int8_t*)malloc((frame_width * frame_height) / 4);vBuf = (u_int8_t*)malloc((frame_width * frame_height) / 4);rgbBuf = (u_int8_t*)malloc(frame_width * frame_height * 3);fseek(fp, File_header.bfOffBits, 0);fread(rgbBuf, frame_width * frame_height * 3, 1, fp);// 将BMP文件转为RGB文件 unsigned char* temp = new unsigned char[frame_width * frame_height * 3];unsigned char* temp1 = new unsigned char[frame_width * frame_height * 3];int j = 256 * 256 * 3;for (i = 0; j >= 0; i += 3, j -= 3){*(temp + i) = *(rgbBuf + j - 3);*(temp + i + 1) = *(rgbBuf + j - 2);*(temp + i + 2) = *(rgbBuf + j - 1);}for (i = 0; i < 256; i++){for (j = 0; j < 256; j++){*(temp1 + 3 * j + i * 256 * 3) = *(temp + (255 - j) * 3 + i * 256 * 3);*(temp1 + 3 * j + 1 + i * 256 * 3) = *(temp + (255 - j) * 3 + 1 + i * 256 * 3);*(temp1 + 3 * j + 2 + i * 256 * 3) = *(temp + (255 - j) * 3 + 2 + i * 256 * 3);}}
(3)调用RGB2YUV的函数实现RGB到YUV数据的转换
// 将转成的RGB文件再转为YUV文件 bool flip = true;rgb2yuv(frame_width, frame_height, temp1, yBuf, uBuf, vBuf, flip);
(4)写YUV文件
//每张图片40帧,5张图片共200帧 j = 0;for (j = 0; j < 40; j++){fwrite(yBuf, 1, frame_width * frame_height, yuvFile);fwrite(uBuf, 1, (frame_width * frame_height) / 4, yuvFile);fwrite(vBuf, 1, (frame_width * frame_height) / 4, yuvFile);}
(5)程序收尾工作(关闭文件,释放缓冲区)
free(rgbBuf);free(yBuf);free(uBuf);free(vBuf);fclose(fp);}fclose(yuvFile);
3. 总代码
(1)头文件 BMP2YUV.h
#include<iostream>
using namespace std;int rgb2yuv(int x_dim, int y_dim, void* rgb, void* y_out, void* u_out, void* v_out, int flip);
void InitLookupTable();
(2)main函数 main.cpp
#include<windows.h>
#include<stdio.h>
#include "BMP2YUV.h"
#include<iostream>
using namespace std;
#define u_int8_t unsigned __int8
#define u_int unsigned __int32
#define u_int32_t unsigned __int32int main(int argc, char** argv)
{int i = 0, k = 0;const char* bmp_name[5] = { 0 }; //存放bmp图片名bmp_name[0] = argv[1];bmp_name[1] = argv[2];bmp_name[2] = argv[3];bmp_name[3] = argv[4];bmp_name[4] = argv[5];FILE* yuvFile = fopen("out_video.yuv", "wb");BITMAPFILEHEADER File_header; // 文件头 BITMAPINFOHEADER Info_header; // 信息头 int frame_width, frame_height;// 处理五张图片 for (k = 0; k < 5; k++){FILE* fp = fopen(bmp_name[k], "rb");//判断文件是否能打开if (fp == NULL){printf("can't find bmpfilie");exit(0);}//读取文件头if (fread(&File_header, sizeof(BITMAPFILEHEADER), 1, fp) != 1){cout << sizeof(BITMAPFILEHEADER) << endl;printf("read file header error!");exit(0);}// 位图文件头,判断是否为BMP文件 if (File_header.bfType != 0x4D42){printf("Not bmp file!");exit(0);}else{printf("this is a bmp file");}// 位图信息头,从中读取图片的宽、高、位数等信息 if (fread(&Info_header, sizeof(BITMAPINFOHEADER), 1, fp) != 1){printf("read info header error!");exit(0);}frame_width = Info_header.biWidth;frame_height = Info_header.biHeight;printf("\nThis is a %d bits image!\n", Info_header.biBitCount);printf("bmp size: \t%d X %d\n", Info_header.biWidth, Info_header.biHeight);printf("\n");u_int8_t* rgbBuf = NULL;u_int8_t* yBuf = NULL;u_int8_t* uBuf = NULL;u_int8_t* vBuf = NULL;yBuf = (u_int8_t*)malloc(frame_width * frame_height);uBuf = (u_int8_t*)malloc((frame_width * frame_height) / 4);vBuf = (u_int8_t*)malloc((frame_width * frame_height) / 4);rgbBuf = (u_int8_t*)malloc(frame_width * frame_height * 3);fseek(fp, File_header.bfOffBits, 0);fread(rgbBuf, frame_width * frame_height * 3, 1, fp);// 将BMP文件转为RGB文件 unsigned char* temp = new unsigned char[frame_width * frame_height * 3];unsigned char* temp1 = new unsigned char[frame_width * frame_height * 3];int j = 256 * 256 * 3;for (i = 0; j >= 0; i += 3, j -= 3){*(temp + i) = *(rgbBuf + j - 3);*(temp + i + 1) = *(rgbBuf + j - 2);*(temp + i + 2) = *(rgbBuf + j - 1);}for (i = 0; i < 256; i++){for (j = 0; j < 256; j++){*(temp1 + 3 * j + i * 256 * 3) = *(temp + (255 - j) * 3 + i * 256 * 3);*(temp1 + 3 * j + 1 + i * 256 * 3) = *(temp + (255 - j) * 3 + 1 + i * 256 * 3);*(temp1 + 3 * j + 2 + i * 256 * 3) = *(temp + (255 - j) * 3 + 2 + i * 256 * 3);}}// 将转成的RGB文件再转为YUV文件 bool flip = true;rgb2yuv(frame_width, frame_height, temp1, yBuf, uBuf, vBuf, flip);//每张图片40帧,5张图片共200帧 j = 0;for (j = 0; j < 40; j++){fwrite(yBuf, 1, frame_width * frame_height, yuvFile);fwrite(uBuf, 1, (frame_width * frame_height) / 4, yuvFile);fwrite(vBuf, 1, (frame_width * frame_height) / 4, yuvFile);}free(rgbBuf);free(yBuf);free(uBuf);free(vBuf);fclose(fp);}fclose(yuvFile);return 0;
}
(3)BMP2YUV.cpp
#include "stdlib.h"
#include <iostream>
#include "BMP2YUV.h"static float RGBYUV02990[256], RGBYUV05870[256], RGBYUV01140[256];
static float RGBYUV01684[256], RGBYUV03316[256];
static float RGBYUV04187[256], RGBYUV00813[256];int rgb2yuv(int x_dim, int y_dim, void* rgb, void* y_out, void* u_out, void* v_out, int flip)
{static int init_done = 0;long i, j, size;unsigned char* r, * g, * b;unsigned char* y, * u, * v;unsigned char* pu1, * pu2, * pv1, * pv2, * psu, * psv;unsigned char* y_buffer, * u_buffer, * v_buffer;unsigned char* sub_u_buf, * sub_v_buf;if (init_done == 0){InitLookupTable();init_done = 1;}// 检查x_dim和y_dim能否被2整除 if ((x_dim % 2) || (y_dim % 2)) return 1;size = x_dim * y_dim;// 分配内存 y_buffer = (unsigned char*)y_out;sub_u_buf = (unsigned char*)u_out;sub_v_buf = (unsigned char*)v_out;u_buffer = (unsigned char*)malloc(size * sizeof(unsigned char));v_buffer = (unsigned char*)malloc(size * sizeof(unsigned char));if (!(u_buffer && v_buffer)){if (u_buffer) free(u_buffer);if (v_buffer) free(v_buffer);return 2;}b = (unsigned char*)rgb;y = y_buffer;u = u_buffer;v = v_buffer;// 将RGB转换为YUV if (!flip) {for (j = 0; j < y_dim; j++){y = y_buffer + (y_dim - j - 1) * x_dim;u = u_buffer + (y_dim - j - 1) * x_dim;v = v_buffer + (y_dim - j - 1) * x_dim;for (i = 0; i < x_dim; i++) {// RGB文件按 BGRBGR…顺序保存 g = b + 1;r = b + 2;// 按亮度方程转换,对色差信号引入压缩系数,进行归一化处理*y = (unsigned char)(RGBYUV02990[*r] + RGBYUV05870[*g] + RGBYUV01140[*b]);*u = (unsigned char)(-RGBYUV01684[*r] - RGBYUV03316[*g] + (*b) / 2 + 128);*v = (unsigned char)((*r) / 2 - RGBYUV04187[*g] - RGBYUV00813[*b] + 128);b += 3;y++;u++;v++;}}}else {for (i = 0; i < size; i++){// RGB文件按 BGRBGR…顺序保存 g = b + 1;r = b + 2;// 按亮度方程转换,对色差信号引入压缩系数,进行归一化处理 *y = (unsigned char)(RGBYUV02990[*r] + RGBYUV05870[*g] + RGBYUV01140[*b]);*u = (unsigned char)(-RGBYUV01684[*r] - RGBYUV03316[*g] + (*b) / 2 + 128);*v = (unsigned char)((*r) / 2 - RGBYUV04187[*g] - RGBYUV00813[*b] + 128);b += 3;y++;u++;v++;}}// 子样本 UV for (j = 0; j < y_dim / 2; j++){psu = sub_u_buf + j * x_dim / 2;psv = sub_v_buf + j * x_dim / 2;pu1 = u_buffer + 2 * j * x_dim;pu2 = u_buffer + (2 * j + 1) * x_dim;pv1 = v_buffer + 2 * j * x_dim;pv2 = v_buffer + (2 * j + 1) * x_dim;for (i = 0; i < x_dim / 2; i++){// 以正方形4个像素为单位共享1个uv,即进行下采样*psu = (*pu1 + *(pu1 + 1) + *pu2 + *(pu2 + 1)) / 4;*psv = (*pv1 + *(pv1 + 1) + *pv2 + *(pv2 + 1)) / 4;psu++;psv++;pu1 += 2;pu2 += 2;pv1 += 2;pv2 += 2;}}free(u_buffer);free(v_buffer);return 0;
}// 查找表函数
void InitLookupTable()
{int i;for (i = 0; i < 256; i++) RGBYUV02990[i] = (float)0.2990 * i;for (i = 0; i < 256; i++) RGBYUV05870[i] = (float)0.5870 * i;for (i = 0; i < 256; i++) RGBYUV01140[i] = (float)0.1140 * i;for (i = 0; i < 256; i++) RGBYUV01684[i] = (float)0.1684 * i;for (i = 0; i < 256; i++) RGBYUV03316[i] = (float)0.3316 * i;for (i = 0; i < 256; i++) RGBYUV04187[i] = (float)0.4187 * i;for (i = 0; i < 256; i++) RGBYUV00813[i] = (float)0.0813 * i;
}
六.实验结果
对整个程序进行调试,并将生成的YUV文件用播放软件观看,验证是否正确。
实验要求:在图像处理软件中自行生成多个BMP文件,至少含5个不同的场景画面,要求带含有班级、学号后四位和本人姓名(缩写或昵称均可)的logo。(基本要求为24bit的BMP,进阶要求为支持小于24bit的BMP。)编写将第一步所生成的多个BMP文件转化为YUV文件,要求可在命令行中设置每个画面出现的帧数。最后形成的YUV文件应至少包含200帧。
yuv预览: