最近我们需要大量的文案配音来做矩阵号项目,尽管网络上有许多提供AI配音的网站、小程序和软件,但这些产品通常需要购买会员才能使用。
我经过搜索和测试,发现了三种比较可靠的纯免费 AI 配音方法,它们各有优缺点,我做了如下的归纳总结:
一.微软Azure
提供文字转语音服务
支持超过119种语言和变体,并配备超过270种神经语音,这些语音非常富有表现力,听起来非常类似于人类的声音。这些服务可以帮助将你的方案(比如文本阅读器和语音助手)变成现实。
该神经网络文本到语音转换功能可以支持多种话语风格,包括聊天、新闻播报和客户服务,同时也可以表达各种情感,比如快乐和同情。使用方式为通过网页版进行,无需下载或注册,可以直接使用。
优点:目前,微软提供了大量的AI配音音色,而你在观看的短视频中所听到的配音多数来自于微软,文稿的字数上限不限制。
缺点:录制和导出需要的时间会随着文稿长度的增加而增加。
使用方法具体说明:
打开网页后,不需要注册账户等其他步骤,直接滑动页面至出现文本输入框,将你的文稿输入其中。在右侧选择语言、语音、说话风格、语速和音调。
在选择音频后,点击“播放”按钮,经过一段加载时间后,音频会自动开始播放。为了正常使用,需事先打开相应软件。我常用的是Adobe Audition(2019版),而Pr则是大家常用的Adobe软件之一。
Audition非常适合处理音频效果,网上有各种方法可以获得它,具体方法此处不再赘述。只需等待语音朗读完毕,就可以录制音频并将其导出为音频文件,关于学习Audition的方法,只需要在百度上搜索,就会有很多相关文章。
二.智影
智影是企鹅公司开发的一个功能非常丰富的平台,目前所有功能都可以完全免费使用。该平台的界面非常简洁,没有任何广告。
该功能包括文本转配音、字幕识别、视频剪辑、文章转视频、数字人播报、智能去水印等。使用方式为网页版,无需下载,但需要注册。
优点:这个产品提供多种音色供用户选择,其中包括一些模仿王者荣耀游戏中角色的音色(如安琪拉、李白、赵云等),还提供不同方言的选择,显示出强烈的本土化特色。
这个工具有多种功能可供选择,比如插入停顿、局部变速等,还能自动检测多音,同时也可以通过选择来切换发音人,非常适合对话模式。在同一篇文稿里也能实现这些功能。
缺点:文稿的长度限制为5000个汉字或800个英文单词。生成音频素材需要时间,并且只能生成mp3格式,尽管通常来说这已经足够用了。
使用方法具体说明:
只要点击网页,就可以进行注册并使用。
三.AI配音专家
是一款免费且开源的文字转语音软件,它具有强大的功能。此软件由吾爱论坛作者bawangxx开发,支持Win系统和Mac系统。下载并安装软件,首次使用时需要进行AccessKey设置。
优点:语音合成的转换方便,支持Win系统和Mac系统,并且可以直接将文件导出为WAV或mp3格式,因此非常适合批量操作,比如在公司多台电脑上安装后使用。
缺点:安装初期相对繁琐,音色的选择相对不够丰富。
使用方法具体说明:
安装软件的步骤是下载软件并按照操作进行安装。
在使用过程中,最麻烦的地方是前期的设置。在软件的高级设置中,你需要自定义三个Key的值:AccessKey ID、AccessKey Secret、Appkey。如果不进行这些设置,就会导致导出失败,不能使用。
写在最后,赤辰最近All in Ai,一切工作流和生活流几乎都试着重塑一遍,持续输出更多自用案例及实践思考和最新学习技术资料,公众浩:赤辰AI运营变现实操记,欢迎关注!