人脸检测+调整分辨率+调整帧率

embedded/2024/10/18 18:16:19/
  1. 初始检测:只在视频的前几秒内进行一次人脸检测,以确定主持人的大致位置。
  2. 计算裁剪框:基于检测到的主持人位置,计算一个以主持人面部为中心的固定裁剪框。
  3. 视频裁剪:使用计算出的裁剪框对整个视频进行裁剪,将视频分辨率调整为512x512。 帧率调整:将视频帧率调整至25fps。
  4. 音频保留:确保裁剪和帧率调整后的视频音频与原视频同步。

以下是优化后的代码:

python">import cv2
import numpy as np
import face_recognition
from moviepy.editor import VideoFileClip, AudioFileClip
from tqdm import tqdmdef find_host_face_location(video_path):""" 在视频的前几秒内检测并返回主持人面部的大致位置 """cap = cv2.VideoCapture(video_path)found_face = Falsewhile cap.isOpened():ret, frame = cap.read()if not ret:break# 缩小帧尺寸以加快处理速度small_frame = cv2.resize(frame, (0, 0), fx=0.25, fy=0.25)rgb_small_frame = small_frame[:, :, ::-1]# 检测人脸face_locations = face_recognition.face_locations(rgb_small_frame)if face_locations:# 取第一张脸的位置,假设主持人位于视频画面的中心位置附近host_face_location = face_locations[0]# 将位置放大回原始大小host_face_location = (host_face_location[0]*4, host_face_location[1]*4, host_face_location[2]*4, host_face_location[3]*4)found_face = Truebreak# 如果已经处理了前10秒的视频,且没有找到人脸,则退出循环if cap.get(cv2.CAP_PROP_POS_MSEC) > 10000:breakcap.release()return host_face_location if found_face else Nonedef calculate_cropping_box(face_location, frame_shape):""" 根据主持人面部位置计算裁剪框 """top, right, bottom, left = face_locationcenter_x, center_y = (left + right) // 2, (top + bottom) // 2half_width, half_height = 256, 256left_cropped = max(center_x - half_width, 0)top_cropped = max(center_y - half_height, 0)right_cropped = min(center_x + half_width, frame_shape[1])bottom_cropped = min(center_y + half_height, frame_shape[0])return (top_cropped, right_cropped, bottom_cropped, left_cropped)def process_video(input_path, output_path):""" 处理视频,裁剪并调整帧率 """# 检测主持人面部位置host_face_location = find_host_face_location(input_path)if host_face_location is None:print(f"No face detected in video {input_path}")return# 读取视频,获取视频的宽度和高度clip = VideoFileClip(input_path)frame_shape = clip.size[::-1]  # 电影剪辑的尺寸是(width, height),我们需要(height, width)# 计算裁剪框cropping_box = calculate_cropping_box(host_face_location, frame_shape)# 裁剪视频cropped_clip = clip.crop(x1=cropping_box[3], y1=cropping_box[0], x2=cropping_box[1], y2=cropping_box[2])cropped_clip = cropped_clip.resize((512, 512))# 调整帧率cropped_clip = cropped_clip.set_fps(25)# 保存最终视频cropped_clip.write_videofile(output_path, codec='libx264', audio_codec='aac')# 清理资源cropped_clip.close()if __name__ == "__main__":for i in tqdm(range(1, 75), desc="Processing videos"):input_path = f"data/{i}/{i}.mp4"output_path = f"data/{i}/{i}_fc1.mp4"process_video(input_path, output_path)

代码解释

  1. find_host_face_location 函数:这个函数负责在视频的前几秒内查找主持人面部的大致位置。我们假设主持人在视频开始时就已经出现在画面中,并且通常位于画面的中心位置附近。

  2. calculate_cropping_box 函数:根据主持人面部的位置计算出一个裁剪框,使得裁剪后的视频以主持人面部为中心。

  3. process_video 函数:此函数执行视频的裁剪和帧率调整。首先,我们使用find_host_face_location函数找到主持人面部的位置。接着,使用calculate_cropping_box函数计算裁剪框。然后,我们使用moviepy库来裁剪视频、调整尺寸和帧率,并保存最终的视频。

注意事项

  • 我们假定主持人在视频开始时就已经出现并且位置相对固定。如果主持人在视频中移动或有多个主持人,此方法可能需要进一步的调整。
  • 使用moviepy进行视频处理可以简化代码并提高效率,但请注意moviepy对视频文件的读写操作可能会消耗较多资源。

确保在运行此代码之前,已经安装了face_recognitionmoviepy库及其依赖项。如果在执行过程中遇到任何问题,如资源限制或库版本冲突,请相应地调整配置或更新库版本。


http://www.ppmy.cn/embedded/58729.html

相关文章

EasyExcel文档链接与使用示例

文档链接 注解 https://blog.csdn.net/estelle_belle/article/details/134508223 官方文档地址 https://github.com/alibaba/easyexcel/tree/master?tabreadme-ov-file 使用示例 依赖版本 <dependency><groupId>com.alibaba</groupId><artifactId>…

单例模式的实现

1. 引言 1.1 背景 当在应用程序中需要控制资源共享、进行配置管理和日志记录等操作时&#xff0c;一种常见的需求是希望通过一个全局访问点&#xff0c;让程序无论在哪个地方&#xff0c;只要能够访问到&#xff0c;就可以通过这个全局访问点&#xff0c;来获取相关实例信息。…

第一关:Linux基础知识

Linux基础知识目录 前言LinuxInternStudio 关卡1. InternStudio开发机介绍2. SSH及端口映射2.1 什么是SSH&#xff1f;2.2 如何使用SSH远程连接开发机&#xff1f;2.2.1 使用密码进行SSH远程连接2.2.2 配置SSH密钥进行SSH远程连接2.2.3 使用VScode进行SSH远程连接 2.3. 端口映射…

【区块链 + 智慧政务】一体化政务数据底座平台 | FISCO BCOS应用案例

为进一步贯彻落实《全国一体化政务大数据体系建设方案》、《中共中央国务院关于构建数据基础制度更好发挥 数据要素作用的意见》精神&#xff0c;一体化政务数据底座平台结合相应城市的数字经济现状基础、当前任务及未来发展 战略&#xff0c;规划建设数据底座&#xff0c;持续…

Java rapidocr

基于PaddleOCR&#xff0c;但是官方并未提供Java版本&#xff0c;而RapidOcr解决了这个问题&#xff0c;不想了解OCR相关知识&#xff0c;开箱即用、不想额外再部署OCR服务&#xff0c;可以直接使用&#xff0c;识别效果也不错&#xff0c;但是发现CPU占用非常高&#xff0c;直…

基于B站视频评论的文本分析,采用包括文本聚类分析、LDA主题分析、网络语义分析

研究主题 本研究旨在通过对B站视频评论数据进行文本分析&#xff0c;揭示用户评论的主题、情感倾向和语义结构&#xff0c;助力商业决策。主要技术手段包括Python爬虫、LDA主题分析、聚类分析和语义网络分析。首先&#xff0c;利用Python爬虫采集大量评论数据并进行预处理。运…

Vue3 + Vite项目使用SVG图片

在项目引入SVG时报错 检查路径和SVG均没问题 遂发现需要安装插件后方可使用 1. 安装 vite-svg-loader pnpm install vite-svg-loader 2. 配置 在 vite.config.ts 中 配置如下代码 import vue from vitejs/plugin-vue; import svgLoader from vite-svg-loader;export defa…

数据安全治理:从库级权限申请到表级权限申请

背景 随着数据安全意识的提高&#xff0c;企业越来越重视数据治理和权限管理。传统数仓大多对库级别进行读写授权&#xff0c;仅对人工标记的敏感库进行表级别授权&#xff0c;但由于敏感等级是由人为标记&#xff0c;错误率较高&#xff0c;故期望将权限申请流程细化到表级申…