前述SunoAI之Bark,听起来总有点老外说中文的味道,很不地道纯正。下面玩一玩百度飞桨--PaddleSpeech,这是一个简单易用的all-in-one 的语音工具箱,支持语音识别,语音合成,声纹识别,声音分类,语音翻译,标点恢复,语音唤醒等多个方向的开发工作。
项目地址:https://github.com/PaddlePaddle/PaddleSpeech
强烈建议在Linux中使用python>=3.8和paddlepaddle>=2.5.0安装 PaddleSpeech 。
1、安装
# cpu 版本的示例
conda activate sadtalker
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
# pip install paddlespeech
git clone https://github.com/PaddlePaddle/PaddleSpeech.git
cd PaddleSpeech
pip install pytest-runner
pip install .
2、自动语音识别
mkdir /home/project/PaddleSpeech
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav
paddlespeech asr --lang zh --input zh.wav
# 使用python代码
>>> from paddlespeech.cli.asr.infer import ASRExecutor
>>> asr = ASREx