借助各大模型的优点生成原创视频(真人人声)Plus

news/2024/11/30 6:33:30/

【技术背景】

众所周知,组成视频的3大元素,即文本+语音+图片。接着小编逐一介绍生成原创视频的过程。

【文本生成】

天工AI搜索(thttp://iangong.cn)

直接手机短信验证就可以使用,该大模型已经接入互联网,注意下图提问方式。注意,细心的筒子已经发现,该回答可能已经包含了我乎的优质答案。

ChatGPT(http://intumu.com )

天工给搜索整理出来的文案逻辑性可能存在一定的问题,尤其是几个答案的组合,就需要重新润色、梳理;经过测试,ChatGPT3.5以上在润色文档的表现要比文心一言好一些。

prompt:“文案****,请对上述文案进行润色。”

文心一言(http://yiyan.baidu.com)

上述文本获取之后,便可以直接转换为音频,但是为了在小红书平台取得更好的效果,就需要对其进行提炼。

prompt:“文案****,请用小红书文案格式进行概括。”

【语音生成】

讯飞星火(http://xinghuo.xfyun.cn/desk

真人人声训练,可以避免千篇一律的机器人声音,这个时候需要借助工具,将你自己的声音导出。

真人人声训练,在星火PC界面右上角有三道横杠,需要录制自己的声音,远程进行训练,训练完成后就可以用自己的声音朗读文案。

使用该工具可以在软件目录result生成对应文案你的真人人声MP3

【视频素材】

(1)视频素材可以使用必剪工具,图文成片,必剪可以根据文案生成对应的素材,字幕,背景音乐等。这个时候,我们需要删除字幕、背景音乐,只保留视频素材。

(2)视频素材还可以使用换脸工具,对其他场景视频进行换脸操作。

这个工具当前最大的缺点就是使用CPU太慢,人脸处于正面时效果尚可。当然,你有GPU或者其他更好的工具,也可以忽略这一步。

【视频生成】

加载【语音生成】生成的真人人声MP3,以及【视频素材】生成的换脸后 的视频素材MP4,再旧借助必剪工具的智能字幕根据真人人身匹配文案,这个时候可能出现原有视频素材MP4长度大于或短于真人人声,则需要进行修订(修剪或复制)。

最后,换上自己喜欢的背景音乐,加上封面,Over。

【电气工程】专业发展方向与建议4 播放 · 0 赞同视频​编辑​

civilpy:【真人语音】讯飞星火个人声音训练及导出下载工具V0.2.exe0 赞同 · 0 评论文章​编辑

civilpy:AI人脸替换工具离线版v2.00 赞同 · 0 评论文章​编辑

civilpy:如何借助各个大模型的优点生成原创视频(真人人声)0 赞同 · 1 评论文章​编辑


http://www.ppmy.cn/news/1102169.html

相关文章

D - 超级赛亚ACMer

百小度是一个ACMer,也是一个超级赛亚人,每个ACMer都有一个战斗力,包括百小度。所谓超级赛亚人的定义,是说如果在对抗中刚好接近极限状态,那就会激发斗志,实力提升. 具体来说,就是百小度现在要接…

【redis进阶】基础知识简要回顾

1. 常见功能介绍 聚合统计 使用list集合的差集、并集来统计 排序统计 SortedSet(ZSet)统计,再利用分页列出权重高的元素 二值状态统计 BitMap存储,获取并统计 SETBIT uid:sign:3000:202008 2 1 GETBIT uid:sign:3000:202008 2…

【MyBatis】四、MyBatis中的动态SQL标签

动态SQL 动态SQL语句是动态的拼接Mybatis中SQL语句的情况&#xff0c;可以动态的在Mybatis中使用SQL if语句 if语句的xml文件&#xff1a; <!-- List<Emp> getEmpByCondition(Emp emp);--><select id"getEmpByCondition" resultType"Emp&…

Android Studio开发入门教程:如何更改APP的图标?

更改APP的图标&#xff08;安卓系统&#xff09; 环境&#xff1a;Windows10、Android Studio版本如下图、雷电模拟器。 推荐图标库 默认APP图标 将新图标拉进src/main/res/mipmap-hdpi文件夹&#xff08;一般app的icon图标是存放在mipmap打头的文件夹下的&#xff09; 更改sr…

Android菜单(上下文菜单)(选项菜单)

菜单资源文件通常放置在res\menu目录下&#xff0c;在创建项目时&#xff0c;默认不自动创建menu目录&#xff0c;所以需要手动创建。Android Resource Directory->value menu 菜单资源根元素通常是<menu></menu>标记&#xff0c;子元素为<item></ite…

End-to-end 3D Human Pose Estimation with Transformer

基于Transformer的端到端三维人体姿态估计 摘要 基于Transformer的架构已经成为自然语言处理中的常见选择&#xff0c;并且现在正在计算机视觉任务中实现SOTA性能&#xff0c;例如图像分类&#xff0c;对象检测。然而&#xff0c;卷积方法在3D人体姿态估计的许多方法中仍然保…

java面试题-MySQL相关面试题

MySQL相关面试题 面试官&#xff1a;MySQL中&#xff0c;如何定位慢查询? 候选人&#xff1a; 嗯~&#xff0c;我们当时做压测的时候有的接口非常的慢&#xff0c;接口的响应时间超过了2秒以上&#xff0c;因为我们当时的系统部署了运维的监控系统Skywalking &#xff0c;在展…

第4章_瑞萨MCU零基础入门系列教程之瑞萨 MCU 源码设计规范

本教程基于韦东山百问网出的 DShanMCU-RA6M5开发板 进行编写&#xff0c;需要的同学可以在这里获取&#xff1a; https://item.taobao.com/item.htm?id728461040949 配套资料获取&#xff1a;https://renesas-docs.100ask.net 瑞萨MCU零基础入门系列教程汇总&#xff1a; ht…