ffplay源码分析(二)结构体VideoState

server/2024/9/24 15:35:56/

在多媒体的世界里,播放器是离用户最近的一环,它将数字编码的音频和视频数据转化为生动的视听体验。ffplay 播放器作为一款强大而备受关注的工具,其背后隐藏着一系列精妙的结构体,它们协同工作,共同完成了从数据读取、解码、渲染到最终呈现的复杂流程。

以下是播放器的一个简单的流程,
在这里插入图片描述

当我们启动 ffplay 播放器,它首先会与数据源建立连接,无论是本地文件、网络流还是其他输入源。。紧接着,数据被源源不断地送入解码器,将压缩编码的数据转换为可处理的原始格式。

在这一流程中,各种关键的结构体开始发挥作用。它们像是精心设计的齿轮,紧密咬合,驱动着播放器的每一个环节。分析源码时,结构体就像是源码的目录,可以对整个播放器的运作流程有一个简单的理解。所以看这部分的内容时,不用纠结于每一个字段的意义,有一个大概的印象即可。

ffplayVideoState_9">ffplay的核心:VideoState

以下是添加了详细注释的结构体 VideoState

typedef struct VideoState {SDL_Thread *read_tid;     // 读线程的线程IDconst AVInputFormat *iformat;     // 输入格式int abort_request;    // 中断请求标志int force_refresh;     // 强制刷新标志int paused;           // 播放是否暂停标志int last_paused;      // 上一次的暂停状态int queue_attachments_req; // 是否请求附带图片(如MP3或AAC文件的专辑封面等)int seek_req;         // 是否请求跳转int seek_flags;       // 跳转标志int64_t seek_pos;     // 跳转位置int64_t seek_rel;     // 跳转相对位置int read_pause_return; // 发送暂停请求的结果(例如RTSP暂停消息是否成功)AVFormatContext *ic;     // 格式上下文int realtime;         // 是否为实时播放Clock audclk;         // 音频时钟Clock vidclk;         // 视频时钟Clock extclk;         // 外部时钟FrameQueue pictq;     // 图像帧队列FrameQueue subpq;     // 字幕帧队列FrameQueue sampq;     // 音频采样帧队列Decoder auddec;       // 音频解码器Decoder viddec;       // 视频解码器Decoder subdec;       // 字幕解码器/*******************音视频同步相关************************/int audio_stream;     // 音频流的索引int av_sync_type;     // 音视频同步类型double audio_clock;   // 当前音频时钟值int audio_clock_serial; // 音频时钟序列号double audio_diff_cum; // 音频差异累计值(用于计算平均差异)double audio_diff_avg_coef; // 音频差异平均系数double audio_diff_threshold; // 音频差异阈值int audio_diff_avg_count;    // 音频差异平均计数AVStream *audio_st;  // 音频流PacketQueue audioq;  // 音频包队列int audio_hw_buf_size;  // 音频硬件缓冲区大小uint8_t *audio_buf;     // 音频缓冲区uint8_t *audio_buf1;    // 重采样音频缓冲区unsigned int audio_buf_size; // 音频缓冲区大小(字节)unsigned int audio_buf1_size; // 重采样音频缓冲区大小(字节)int audio_buf_index;   // 音频缓冲区播放位置int audio_write_buf_size; // 当前音频缓冲区中未播放的数据大小int audio_volume;      // 音频音量int muted;             // 是否静音struct AudioParams audio_src; // 音频源参数struct AudioParams audio_filter_src; // 音频滤波源参数struct AudioParams audio_tgt; // 音频目标参数struct SwrContext *swr_ctx;  // 音频重采样上下文int frame_drops_early; // 解码器队列中由于同步问题而提前丢弃的帧int frame_drops_late;  // 由于播放延迟而丢弃的帧enum ShowMode {SHOW_MODE_NONE = -1, SHOW_MODE_VIDEO = 0, SHOW_MODE_WAVES, SHOW_MODE_RDFT, SHOW_MODE_NB} show_mode;          // 显示模式/*******************音频可视化相关************************/int16_t sample_array[SAMPLE_ARRAY_SIZE]; // 音频可视化数据int sample_array_index;  // 音频可视化数据索引int last_i_start; // 上一次计算的音频显示起始索引AVTXContext *rdft;     // 快速傅里叶变换上下文av_tx_fn rdft_fn;     // 快速傅里叶变换函数指针int rdft_bits;       // 快速傅里叶变换的位数float *real_data;    // 实部数据AVComplexFloat *rdft_data; // 复数数据int xpos;            // x 位置double last_vis_time; // 上一次可视化时间/*******************渲染纹理相关************************/SDL_Texture *vis_texture; // 音频可视化纹理SDL_Texture *sub_texture; // 字幕纹理SDL_Texture *vid_texture; // 视频纹理int subtitle_stream; // 字幕流的索引AVStream *subtitle_st; // 字幕流PacketQueue subtitleq; // 字幕包队列double frame_timer;  // 帧定时器double frame_last_returned_time; // 上一帧的显示时间戳double frame_last_filter_delay; // 上一帧的滤镜延迟int video_stream;    // 视频流的索引AVStream *video_st;  // 视频流PacketQueue videoq;  // 视频包队列double max_frame_duration; // 最大帧持续时间struct SwsContext *sub_convert_ctx; // 字幕转换上下文int eof;             // 文件结束标志char *filename;      // 文件名int width;          // 播放窗口宽度int height;         // 播放窗口高度int xleft;          // 显示区域的左偏移int ytop;           // 显示区域的上偏移int step;           // 步进模式(单帧模式)int vfilter_idx;    // 视频滤镜索引AVFilterContext *in_video_filter; // 视频输入滤镜上下文AVFilterContext *out_video_filter; // 视频输出滤镜上下文AVFilterContext *in_audio_filter; // 音频输入滤镜上下文AVFilterContext *out_audio_filter; // 音频输出滤镜上下文AVFilterGraph *agraph; // 音频滤镜图int last_video_stream; // 上一次的视频流索引int last_audio_stream; // 上一次的音频流索引int last_subtitle_stream; // 上一次的字幕流索引SDL_cond *continue_read_thread; // 读线程条件变量
} VideoState;

http://www.ppmy.cn/server/106247.html

相关文章

如何给上万张照片打上标签?,提高整理素材效率!

在数字时代,照片和图像已成为我们记录生活、工作和创造的重要方式。然而,随着照片数量的激增,如何有效管理和分类这些照片成为了一个挑战。今天,我要和大家分享一个高效的解决方案——利用AI技术给照片打标签,从而提高…

Qt WebSocket

简介 WebSocket 是一种网络传输协议,可在单个 TCP 连接上进行全双工通信,位于 OSI 模型的应用层。允许服务端主动向客户端推送数据。 在 WebSocket API 中,浏览器和服务器只需要完成一次握手,两者之间就可以创建持久性的连接&am…

【Java】—— Java面向对象基础:Person类实例操作

目录 一、定义Person类 二、创建Person对象并操作 三、理解对象之间的关系 四、总结 在Java编程中,面向对象编程(OOP)是一种非常核心且广泛使用的编程范式。它允许我们通过类(Class)来定义对象的属性和行为&#x…

面试题目:(6)翻转二叉树

题目 翻转二叉树 (中间对称翻转,等于镜像)给你一棵二叉树的根节点 root ,翻转这棵二叉树,并返回其根节点。示例1: 输入:root [4,2,7,1,3,6,9]输出:[4,7,2,9,6,3,1]示例1&#xff1…

Baumer工业相机堡盟工业相机如何通过BGAPI SDK设置相机本身的数据保存(CustomData)功能(Python)

Baumer工业相机堡盟工业相机如何通过BGAPI SDK设置相机本身的数据保存(CustomData)功能(Python) Baumer工业相机Baumer工业相机的数据保存(CustomData)功能的技术背景CameraExplorer如何使用数据保存&#…

【C#】【EXCEL】Bumblebee/Classes/ExRange.cs

Flow diagram 为了创建一个全面但不过于复杂的流程图,我们将重点关注 ExRange 类的主要功能和方法。以下是一个中英双语的流程图,展示了 ExRange 类的主要结构和操作流程: #mermaid-svg-SYKM6gZKQKi0qEx1 {font-family:"trebuchet ms&q…

Django Signals

Django Signals 当某个事件发生的时候,signal(信号)允许senders(发送者)用来通知receivers(接收者),通知receivers干嘛?你想要recivers干嘛就可以干嘛。这在多处代码对同一个事件感兴趣的时候就有用武之地了。 比如:Django提供了…

找在两个汉字中间的句号,如何写正则表达式?

要在两个汉字之间找到句号&#xff0c;可以使用以下正则表达式&#xff1a; (?<[\u4e00-\u9fff])。(?[\u4e00-\u9fff])解释&#xff1a; (?<[\u4e00-\u9fff]) 表示前面的字符是汉字。。 表示句号。(?[\u4e00-\u9fff]) 表示后面的字符是汉字。 这个正则表达式将匹配…