ffmpeg 将视频帧转换成jpg、png等图片

news/2025/1/16 7:52:37/

文章目录

  • 前言
  • 一、如何实现?
    • 1、查找编码器
    • 2、构造编码器上下文
    • 3、像素格式转换
    • 4、编码
    • 5、获取图片数据
    • 6、销毁资源
  • 二、完整代码
  • 三、使用示例
    • 1、视频帧保存jpg文件
    • 2、自定义数据构造AVFrame
  • 总结


前言

有时播放实时流的时候有截图的需求,需要将解码出来的图片保存本地或上传服务器,这时就需要将avframe中的数据编码成png、jpg等格式的图片,我们使用ffmpeg的相关编码器就可以实现功能。


一、如何实现?

1、查找编码器

首先需要查找图片编码器,比如jpg为AV_CODEC_ID_MJPEG,png为AV_CODEC_ID_PNG

示例代码:

enum AVCodecID codec = avcodec_find_encoder(AV_CODEC_ID_MJPEG);

2、构造编码器上下文

有了编码器就可以构造编码器上下文了。

AVCodecContext*ctx = avcodec_alloc_context3(codec);
ctx->bit_rate = 3000000;
ctx->width = frame->width;//视频帧的宽
ctx->height = frame->height;//视频帧的高
ctx->time_base.num = 1;
ctx->time_base.den = 25;
ctx->gop_size = 10;
ctx->max_b_frames = 0;
ctx->thread_count = 1;
ctx->pix_fmt = *codec->pix_fmts;//使用编码器适配的像素格式
//打开编码器
avcodec_open2(ctx, codec, NULL);

3、像素格式转换

如果输入视频帧的像素和编码器的像素格式不相同则需要转换像素格式,我们采用SwsContext 转换即可

AVFrame*rgbFrame = av_frame_alloc();//转换后的帧
swsContext = sws_getContext(frame->width, frame->height, (enum AVPixelFormat)frame->format, frame->width, frame->height, ctx->pix_fmt, 1, NULL, NULL, NULL);
int bufferSize = av_image_get_buffer_size(ctx->pix_fmt, frame->width, frame->height, 1) * 2;
buffer = (unsigned char*)av_malloc(bufferSize);
//构造帧的缓存
av_image_fill_arrays(rgbFrame->data, rgbFrame->linesize, buffer, ctx->pix_fmt, frame->width, frame->height, 1);
sws_scale(swsContext, frame->data, frame->linesize, 0, frame->height, rgbFrame->data, rgbFrame->linesize);
//构造必要的参数
rgbFrame->format = ctx->pix_fmt;
rgbFrame->width = ctx->width;
rgbFrame->height = ctx->height;

4、编码

得到转后的帧就可以编码

ret = avcodec_send_frame(ctx, rgbFrame);

5、获取图片数据

获取解码后的包即可得到图片数据。

uint8_t* outbuf;//输出图片的缓存
size_t outbufSize;//缓存大小
AVPacket pkt;
av_init_packet(&pkt);
//获取解码的包
avcodec_receive_packet(ctx, &pkt);
//将图片数据拷贝到缓存
if (pkt.size > 0 && pkt.size <= outbufSize)
memcpy(outbuf, pkt.data, pkt.size);

6、销毁资源

将上述步骤使用的对象销毁。

if (swsContext)
{sws_freeContext(swsContext);
}
if (rgbFrame)
{av_frame_unref(rgbFrame);av_frame_free(&rgbFrame);
}
if (buffer)
{av_free(buffer);
}
av_packet_unref(&pkt);
if (ctx)
{avcodec_close(ctx);avcodec_free_context(&ctx);
}

二、完整代码

/// <summary>
/// 帧转图片
/// 如果外部提供的缓存长度不足则不会写入。
/// </summary>
/// <param name="frame">[in]视频帧</param>
/// <param name="codecID">[in]图片编码器ID,如jpg:AV_CODEC_ID_MJPEG,png:AV_CODEC_ID_PNG</param>
/// <param name="outbuf">[out]图片缓存,由外部提供</param>
/// <param name="outbufSize">[in]图片缓存长度</param>
/// <returns>返回图片实际长度</returns>
static int frameToImage(AVFrame* frame, enum AVCodecID codecID, uint8_t* outbuf, size_t outbufSize)
{int ret = 0;AVPacket pkt;AVCodec* codec;AVCodecContext* ctx = NULL;AVFrame* rgbFrame = NULL;uint8_t* buffer = NULL;struct SwsContext* swsContext = NULL;av_init_packet(&pkt);codec = avcodec_find_encoder(codecID);if (!codec){printf("avcodec_send_frame error %d", codecID);goto end;}if (!codec->pix_fmts){printf("unsupport pix format with codec %s", codec->name);goto end;}ctx = avcodec_alloc_context3(codec);ctx->bit_rate = 3000000;ctx->width = frame->width;ctx->height = frame->height;ctx->time_base.num = 1;ctx->time_base.den = 25;ctx->gop_size = 10;ctx->max_b_frames = 0;ctx->thread_count = 1;ctx->pix_fmt = *codec->pix_fmts;ret = avcodec_open2(ctx, codec, NULL);if (ret < 0){printf("avcodec_open2 error %d", ret);goto end;}if (frame->format != ctx->pix_fmt){rgbFrame = av_frame_alloc();if (rgbFrame == NULL){printf("av_frame_alloc  fail");goto end;}swsContext = sws_getContext(frame->width, frame->height, (enum AVPixelFormat)frame->format, frame->width, frame->height, ctx->pix_fmt, 1, NULL, NULL, NULL);if (!swsContext){printf("sws_getContext  fail");goto end;}int bufferSize = av_image_get_buffer_size(ctx->pix_fmt, frame->width, frame->height, 1) * 2;buffer = (unsigned char*)av_malloc(bufferSize);if (buffer == NULL){printf("buffer alloc fail:%d", bufferSize);goto end;}av_image_fill_arrays(rgbFrame->data, rgbFrame->linesize, buffer, ctx->pix_fmt, frame->width, frame->height, 1);if ((ret = sws_scale(swsContext, frame->data, frame->linesize, 0, frame->height, rgbFrame->data, rgbFrame->linesize)) < 0){printf("sws_scale error %d", ret);}rgbFrame->format = ctx->pix_fmt;rgbFrame->width = ctx->width;rgbFrame->height = ctx->height;ret = avcodec_send_frame(ctx, rgbFrame);}else{ret = avcodec_send_frame(ctx, frame);}if (ret < 0){printf("avcodec_send_frame error %d", ret);goto end;}ret = avcodec_receive_packet(ctx, &pkt);if (ret < 0){printf("avcodec_receive_packet error %d", ret);goto end;}if (pkt.size > 0 && pkt.size <= outbufSize)memcpy(outbuf, pkt.data, pkt.size);ret = pkt.size;
end:if (swsContext){sws_freeContext(swsContext);}if (rgbFrame){av_frame_unref(rgbFrame);av_frame_free(&rgbFrame);}if (buffer){av_free(buffer);}av_packet_unref(&pkt);if (ctx){avcodec_close(ctx);avcodec_free_context(&ctx);}return ret;
}

三、使用示例

1、视频帧保存jpg文件

void main() {AVFrame* frame;//视频解码得到的帧saveFrameToJpg(frame,"snapshot.jpg");
}
/// <summary>
/// 将视频帧保存为jpg图片
/// </summary>
/// <param name="frame">视频帧</param>
/// <param name="path">保存的路径</param>
void saveFrameToJpg(AVFrame*frame,const char*path) {//确保缓冲区长度大于图片,使用brga像素格式计算。如果是bmp或tiff依然可能超出长度,需要加一个头部长度,或直接乘以2。int bufSize = av_image_get_buffer_size(AV_PIX_FMT_BGRA, frame->width, frame->height, 64);//申请缓冲区uint8_t* buf = (uint8_t*)av_malloc(bufSize);//将视频帧转换成jpg图片,如果需要png则使用AV_CODEC_ID_PNGint picSize = frameToImage(frame, AV_CODEC_ID_MJPEG, buf, bufSize);//写入文件auto f = fopen(path, "wb+");if (f){fwrite(buf, sizeof(uint8_t), bufSize, f);fclose(f);}//释放缓冲区av_free(buf);
}

2、自定义数据构造AVFrame

void main() {uint8_t*frameData;//解码得到的视频数据AVFrame* frame=allocFrame(frameData,640,360,AV_PIX_FMT_YUV420P);saveFrameToJpg(frame,"snapshot.jpg");//此方法定义在示例1中av_frame_free(&frame);
}
/// <summary>
/// 通过裸数据生成avframe
/// </summary>
/// <param name="frameData">帧数据</param>
/// <param name="width">帧宽</param>
/// <param name="height">帧高</param>
/// <param name="format">像素格式</param>
/// <returns>avframe,使用完成后需要调用av_frame_free释放</returns>
AVFrame* allocFrame(uint8_t*frameData,int width,int height,AVPixelFormat format) {AVFrame* frame = av_frame_alloc();frame->width = width;frame->height = height;frame->format = format;av_image_fill_arrays(frame->data, frame->linesize, frameData, format, frame->width, frame->height, 64);return frame;
}

总结

以上就是今天要讲的内容,总的来说整个流程和一般的视频编码是一致的,只是选择的编码器不同,拿到的图片数据在内存中,可以直接网络传输或保存到本地。可以很方便的在视频界面过程中截图,尤其是解码使用ffmpeg的情况下。实现也不算难,写成文章是为了以后能直接复用,毕竟时间久了一些细节还是会遗忘的。


http://www.ppmy.cn/news/37866.html

相关文章

scala面向对象

目录 一.定义类 基本语法&#xff1a; 1.2属性 1.3 封装 1.4 访问权限 1.5创建对象 1.6构造器 1.7继承和多态 多态 1.8抽象类 1.9匿名子类 1.10单例对象&#xff08;伴生对象&#xff09; 1.11 apply方法 1.12特质&#xff08;Trait&#xff09; 1.13使用特质的基…

Chat GPT:软件测试人员的危机?

Chat GPT&#xff0c;作为一个引起科技巨头“红色警报”的人工智能语言模型&#xff0c;短期内便席卷全球&#xff0c;上线仅两个月活跃用户破亿。比尔盖茨更是如此评价“这种AI技术出现的重大历史意义&#xff0c;不亚于互联网和个人电脑的诞生。” 在各个行业备受关注的Chat …

定点乘法器----部分积压缩(华为杯)

一. 简介 在上篇文章中&#xff0c;已经介绍了如何使用booth算法生成部分积了&#xff0c;那么在这篇文章中将介绍如何使用加法树对部分积进行压缩。加法树压缩有多种形式&#xff0c;常见的是Wallace压缩&#xff0c;也是赛题中介绍一种方法。 感兴趣的可以&#xff0c;可以研…

爬虫day2 正则表达式作业

利用正则表达式完成下面的操作: 一、不定项选择题 能够完全匹配字符串"(010)-62661617"和字符串"01062661617"的正则表达式包括&#xff08;ABD&#xff09; A. r"\(?\d{3}\)?-?\d{8}" B. r"[0-9()-]" 中括号里面的字符出现任意次…

银行数字化转型导师坚鹏:银行数字化领导力提升之道

银行数字化领导力提升之道 ——融合中西智慧&#xff0c;践行知行合一思想&#xff0c;实现知行果合一 课程背景&#xff1a; 很多银行存在以下问题&#xff1a;不知道如何领导数字员工&#xff1f;不清楚银行数字化领导力模型的内涵&#xff1f;不知道如何开展银行数字化…

现在的年轻人真会玩,开发界面都这么时尚,不服老都不行了

文章目录一、你还在用传统的开发界面吗二、年轻人的界面1.动漫型2.偶像型3.提神型三、更换背景的操作第一步第二步第三步一、你还在用传统的开发界面吗 不比不知道&#xff0c;一比吓一跳&#xff0c;都2023年了&#xff0c;你还在用Pycharm的默认背景写代码吗&#xff1f;已经…

GFS分布式文件系统

目录 一、GlusterFS分布式文件系统 1、什么是GlusterFS及其术语 2、GlusterFS特点 3、GlusterFS工作原理流程 4、GlusterFS的卷类型 ①、分布式卷 ②、条带卷 ③、复制卷 ④、分布式条带卷 ⑤、分布式复制卷 5、GlusterFS群集部署 ①实验环境 ②磁盘配置 ③修改主…

MySQL数据库——常用数据库访问接口简介,数据库的种类有哪些?

不同的程序设计语言会有各自不同的数据库访问接口&#xff0c;程序语言通过这些接口&#xff0c;执行 SQL 语句&#xff0c;进行数据库管理。主要的数据库访问接口主要有 ODBC、JDBC、ADO.NET 和 PDO。 ODBC ODBC&#xff08;Open Database Connectivity&#xff0c;开放数据…