FunClip模型介绍
FunClip是由阿里达摩院精心打造的一款完全开源、本地部署的自动化视频剪辑工具。FunClip让用户能够根据识别结果,轻松选择文本片段或特定说话人,从而快速裁剪出所需视频片段。FunClip的特色功能包括集成高精度的中文ASR模型、支持热词定制化、说话人识别,以及提供Gradio交互界面,大大简化了视频剪辑的复杂度。此外,FunClip还支持多段剪辑,并且能够自动为视频生成SRT字幕文件。
启动应用
首先,进入星海智算平台,点击【GPU实例】,即可创建实例。
在【选择配置】中,可选择不同区域的显卡。
在【镜像市场】点击更换镜像,选择FunClip镜像,确认后在实例创建页面点击<立即创建>即可。
创建成功等待4-5分钟,看到<运行中>即可开始使用,点击应用链接即可跳转到对应的WebUI。
镜像操作
待程序打开后呈现的就是FunClip主页面
01
上传视频或音频文件(或选择下方的示例视频),点击 识别 按钮
假如上传的视频/音频中有多人说话,点击 识别+区分说话人 按钮
02
复制识别结果中所需的文字至右上方,或者右设置说话人标识,设置 偏移 与 字幕配置 (可选)
03
点击 裁剪 按钮或 裁剪并添加字幕 按钮获得结果
注:自动识别的字幕有时会因为口音和中英文识别问题而出现错字或多余字词。遇到此类情况时,您可以在"待裁剪文本"中进行编辑和修改。