MoneyPrinterTurbo - AI自动生成高清短视频

embedded/2024/11/18 19:03:07/

MoneyPrinterTurbo是一款基于AI大模型的开源软件,旨在通过一键操作帮助用户自动生成高清短视频。只需提供一个视频 主题或 **关键词** ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。

主要功能 🎯

  • 完整的 **MVC架构**,代码 **结构清晰**,易于维护,支持 API​ 和 Web界面​
  • 支持视频文案 **AI自动生成**,也可以**自定义文案**
  • 支持多种 **高清视频** 尺寸:竖屏 9:16,1080x1920​,横屏 16:9,1920x1080​
  • 支持 **批量视频生成**,可以一次生成多个视频,然后选择一个最满意的
  • 支持 **视频片段时长** 设置,方便调节素材切换频率
  • 支持 **中文** 和 **英文** 视频文案
  • 支持 **多种语音** 合成,可 **实时试听** 效果
  • 支持 **字幕生成**,可以调整 字体​、位置​、颜色​、大小​,同时支持字幕描边​设置
  • 支持 **背景音乐**,随机或者指定音乐文件,可设置背景音乐音量​
  • 视频素材来源 **高清**,而且 **无版权**,也可以使用自己的 **本地素材**
  • 支持 **OpenAI**、**Moonshot**、**Azure**、**gpt4free**、**one-api**、**通义千问**、**Google Gemini**、**Ollama**、 **DeepSeek**、 **文心一言** 等多种模型接入

安装使用

配置要求 📦
  • 建议最低 CPU 4核或以上,内存 8G 或以上,显卡非必须
  • Windows 10 或 MacOS 11.0 以上系统
快速开始 🚀

下载一键启动包,解压直接使用(路径不要有 **中文**、**特殊字符**、**空格**)

Windows
  • 百度网盘(1.2.1 最新版本): 百度网盘 请输入提取码 提取码: g36q

下载后,建议先**双击执行** update.bat​ 更新到**最新代码**,然后双击 start.bat​ 启动

启动后,会自动打开浏览器(如果打开是空白,建议换成 **Chrome** 或者 **Edge** 打开)

其他系统

还没有制作一键启动包,看下面的 **安装部署** 部分,建议使用 **docker** 部署,更加方便。

安装部署 📥
前提条件
  • 尽量不要使用 **中文路径**,避免出现一些无法预料的问题
  • 请确保你的 **网络** 是正常的,VPN需要打开全局流量​模式
① 克隆代码
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
② 修改配置文件
  • 将 config.example.toml​ 文件复制一份,命名为 config.toml​
  • 按照 config.toml​ 文件中的说明,配置好 pexels_api_keys​ 和 llm_provider​,并根据 llm_provider 对应的服务商,配置相关的 API Key
Docker部署 🐳
① 启动Docker

如果未安装 Docker,请先安装 Docker Desktop: The #1 Containerization Tool for Developers | Docker

如果是Windows系统,请参考微软的文档:

  1. 安装 WSL | Microsoft Learn
  2. WSL 上的 Docker 容器入门 | Microsoft Learn
cd MoneyPrinterTurbo
docker-compose up
② 访问Web界面

打开浏览器,访问 http://0.0.0.0:8501

③ 访问API文档

打开浏览器,访问 http://0.0.0.0:8080/docs 或者 http://0.0.0.0:8080/redoc

手动部署 📦

视频教程

  • 完整的使用演示:https://v.douyin.com/iFhnwsKY/
  • 如何在Windows上部署:https://v.douyin.com/iFyjoW3M
① 创建虚拟环境

建议使用 conda 创建 python 虚拟环境

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
② 安装好 ImageMagick
  • Windows:

    • 下载 ImageMagick – Download 选择Windows版本,切记一定要选择 **静态库** 版本,比如 ImageMagick-7.1.1-32-Q16-x64-**static**.exe
    • 安装下载好的 ImageMagick,**注意不要修改安装路径**
    • 修改 配置文件 config.toml​ 中的 imagemagick_path​ 为你的 **实际安装路径**
  • MacOS:

    brew install imagemagick
    
  • Ubuntu

    sudo apt-get install imagemagick
    
  • CentOS

    sudo yum install ImageMagick
    
③ 启动Web界面 🌐

注意需要到 MoneyPrinterTurbo 项目 根目录​ 下执行以下命令

Windows

conda activate MoneyPrinterTurbo
webui.bat

MacOS or Linux

conda activate MoneyPrinterTurbo
sh webui.sh

启动后,会自动打开浏览器(如果打开是空白,建议换成 **Chrome** 或者 **Edge** 打开)

④ 启动API服务 🚀
python main.py

启动后,可以查看 API文档​ http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接在线调试接口,快速体验。

语音合成 🗣

所有支持的声音列表,可以查看:声音列表

2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。

字幕生成 📜

当前支持2种字幕生成方式:

  • **edge**: 生成速度快​,性能更好,对电脑配置没有要求,但是质量可能不稳定
  • **whisper**: 生成速度慢​,性能较差,对电脑配置有一定要求,但是质量更可靠​。

可以修改 config.toml​ 配置文件中的 subtitle_provider​ 进行切换

建议使用 edge​ 模式,如果生成的字幕质量不好,再切换到 whisper​ 模式

注意:

  1. whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅
  2. 如果留空,表示不生成字幕。

由于国内无法访问 HuggingFace,可以使用以下方法下载 whisper-large-v3​ 的模型文件

下载地址:

  • 百度网盘: 百度网盘 请输入提取码
  • 夸克网盘:夸克网盘分享

模型下载后解压,整个目录放到 .\MoneyPrinterTurbo\models​ 里面, 最终的文件路径应该是这样: .\MoneyPrinterTurbo\models\whisper-large-v3​

MoneyPrinterTurbo  ├─models│   └─whisper-large-v3│          config.json│          model.bin│          preprocessor_config.json│          tokenizer.json│          vocabulary.json
背景音乐 🎵

用于视频的背景音乐,位于项目的 resource/songs​ 目录下。

当前项目里面放了一些默认的音乐,来自于 YouTube 视频,如有侵权,请删除。

字幕字体 🅰

用于视频字幕的渲染,位于项目的 resource/fonts​ 目录下,你也可以放进去自己的字体。


http://www.ppmy.cn/embedded/138610.html

相关文章

Vue中template模板报错

直接<v出现如下模板&#xff0c;出现如下错误 注意两个地方&#xff1a; 1.template里面加一个div标签 2.要写name值 如下图

[C++] 异常

文章目录 异常的概念异常的抛出与捕获栈展开&#xff08;Stack Unwinding&#xff09;四、总结 查找匹配的处理代码 异常的重新抛出三、模拟示例&#xff1a;服务模块中的异常处理四、总结 C 异常规范详解一、C98异常规范二、C11及其后的异常规范 (noexcept)三、使用noexcept的…

一、Vue安装

1、安装 1. 必安插件 ( ⽂件夹 ) 下的 google-access-helper-2.3.0( ⽂件夹 ) 复制到你想放的⽂件夹下 ( 安装后不可以挪动 位置 ) 建议 D 盘下 , 弄⼀个专门按软件的⽂件夹 2. 打开⾕歌浏览器 - 扩展程序 - 开发者模式打开 - 把⽂件夹拖进来就安装完毕 功能如下 : ⾕歌…

Docker 基础命令介绍和常见报错解决

介绍一些 docker 可能用到的基础命令&#xff0c;并解决三个常见报错&#xff1a; 权限被拒绝&#xff08;Permission Denied&#xff09;无法连接到 Docker 仓库&#xff08;Timeout Exceeded&#xff09;磁盘空间不足&#xff08;No Space Left on Device&#xff09; 命令以…

Vue3 provide 和 inject的使用

在 Vue 中&#xff0c;provide 和 inject 是 Composition API 的一对功能&#xff0c;用于父子组件之间的依赖注入。它们的作用是让父组件可以向其所有子组件提供数据或方法&#xff0c;而不需要通过逐层传递 props。 1. provide provide 用于父组件中&#xff0c;提供数据或…

多目标优化算法:多目标鹅算法(MOGOOSE)求解UF1-UF10,提供完整MATLAB代码

一、鹅算法GOOSE 鹅算法&#xff08;Goose Algorithm&#xff0c;简称GOOSE&#xff09;是一种新型的元启发式算法&#xff0c;灵感来源于鹅在休息和觅食时的行为。GOOSE算法由Rebwar Khalid Hamad等人于2024年1月发表在Springer旗下的非开源SCI期刊《Evolving Systems》上。该…

Redis 持久化机制 RDB 和 AOF 区别

Redis 是一个开源的内存数据结构存储系统&#xff0c;广泛应用于缓存、会话存储、实时分析等场景。虽然 Redis 本质上是内存数据库&#xff0c;但它支持持久化机制&#xff0c;将数据保存在磁盘中以防止数据丢失。在 Redis 中&#xff0c;主要有两种持久化机制&#xff1a;RDB(…

前端隐藏元素的方式有哪些?HTML 和 CSS 中隐藏元素的多种方法

当面试官突然问你&#xff1a;“前端隐藏元素的方式有哪些&#xff1f;”你还是只知道 display: none 吗&#xff1f; 其实&#xff0c;在前端开发的世界里&#xff0c;隐藏元素的方法非常多。每种方法都有自己的小技巧和使用场景&#xff0c;了解它们不仅能让你应对自如&…