Heygen和D-ID等照片转视频的工具,都需要在线付费使用。本次介绍一个SadTalker数字人。SadTalker有多种使用方式,包括完整安装程序和stable diffusion插件模式。安装程序操作较繁琐,因此推荐stable diffusion插件模式。
文章目录
- SadTalker安装
- SadTalker使用
SadTalker安装
打开SD进入扩展复制链接https://github.com/OpenTalker/SadTalker.git
到安装路径。
安装之后重启SD之后点击SadTalker即可。
下载Checkpoints和gfpgan到extensions\SadTalker文件夹内。
配置ffmpeg。打开ffmpeg官网 下载对应系统的文件,以Windows为例,将压缩包下载到本地并解压,打开bin文件夹,复制路径。
然后右键点击我的电脑-属性-高级系统设置-环境变量-选中Path点击编辑-新建,输入文件夹路径,点击确定。
在cmd里输入命令ffmpeg
出现详细信息即表示ffmpeg安装成功。
SadTalker使用
左侧上传图片和音频文件。
Pose style
选择人脸姿态,一共47个数字,每个姿态都不一样。face model resolution
根据分辨率选择自己对口型的模型,如果图片较大就选择512。preprocess
这个同图生图中的设置GFPGAN as Face enhancer
是否高清化处理。