mac 安装CosyVoice (cpu版本)

news/2024/12/17 22:33:09/

CosyVoice 介绍

CosyVoice 是阿里研发的一个tts大模型

官方项目地址:https://github.com/FunAudioLLM/CosyVoice.git

下载项目(非官方)

git clone --recursive https://github.com/v3ucn/CosyVoice_for_MacOs.git

进入项目

cd CosyVoice_for_MacOs
git submodule update --init --recursive

创建运行环境

conda create -n cosyvoice python=3.8
conda activate cosyvoice

安装依赖

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

# 安装sox

brew install sox

#安装git-lfs(重要,不然下面下载模型能成功,但实际下载不完整,很多人遇到这个坑

brew install git-lfs

# git模型下载,请确保已安装git lfs

mkdir -p pretrained_models
git clone https://www.modelscope.cn/iic/CosyVoice-300M.git pretrained_models/CosyVoice-300M
git clone https://www.modelscope.cn/iic/CosyVoice-300M-25Hz.git pretrained_models/CosyVoice-300M-25Hz
git clone https://www.modelscope.cn/iic/CosyVoice-300M-SFT.git pretrained_models/CosyVoice-300M-SFT
git clone https://www.modelscope.cn/iic/CosyVoice-300M-Instruct.git pretrained_models/CosyVoice-300M-Instruct
git clone https://www.modelscope.cn/iic/CosyVoice-ttsfrd.git pretrained_models/CosyVoice-ttsfrd

配置环境变量

export PYTHONPATH=third_party/Matcha-TTS

运行

python3 webui.py --port 50000 --model_dir pretrained_models/CosyVoice-300M

期间可能遇见下面几种问题

1.
There is no such entity as cosyvoice.utils.common.ras_sampling

cosyvoice模型的问题,这个是由于cosyvoice模型部分添加了一个采样器,但 GitHub 上开源的代码中没有包含该采样器。

解决方法
打开项目目录下的models/TTS/CosyVoice-300M/cosyvoice.yaml文件

屏蔽下面这段代码:

sampling: !name:cosyvoice.utils.common.ras_sampling
top_p: 0.8
top_k: 25
win_size: 10
tau_r: 0.1

---------
2.

cannot import name 'cached_download' from 'huggingface_hub' 

参考 https://blog.csdn.net/weixin_41492426/article/details/143215577

0.26 及以上的版本不支持 cached_download 了。

该库好像对别的库没有啥影响,所以直接装一个旧版本就行了:

pip install huggingface_hub==0.25.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

3.

onnxruntime.capi.onnxruntime_pybind11_state.InvalidProtobuf: [ONNXRuntimeError] : 7 : INVALID_PROTOBUF : Load model from pretrained_models/CosyVoice-300M/campplus.onnx failed:Protobuf parsing failed.

出现这个主要是没有安装好git-lfs,导致没正确下载完整模型,安装好后重新下载模型即可解决。

使用

1.直接生成音频

正常运行起来后会自动开这个界面,然后点击生成音频,如果环境都安装正常,就能正常生成音频。(没有显卡,生成非常慢,按分钟小时算)

2.复刻音色

准确操作上述红色位置后,点击生成,既可以生成音频,同样非常慢。

实验效果还可以的,跟官网demo效果差不多。


http://www.ppmy.cn/news/1555972.html

相关文章

【人工智能】100+目标检测数据集模型算法源码(持续更新中建议收藏)

前言      目标检测在计算机视觉领域扮演着至关重要的角色,其核心任务是在图像或视频中识别并定位特定物体的位置。为了训练和评估这些算法的性能,研究人员和开发者常常依赖于一系列广泛应用的数据集。以下是一些非常有用的目标检测数据集、模型和算…

NVR小程序接入平台/设备EasyNVR深度解析H.265与H.264编码视频接入的区别

随着科技的飞速发展和社会的不断进步,视频压缩编码技术已经成为视频传输和存储中不可或缺的一部分。在众多编码标准中,H.265和H.264是最为重要的两种。今天我们来将深入分析H.265与H.264编码的区别。 一、H.265与H.264编码的区别 1、比特率与分辨率 H.…

springboot集成h2数据库并使用多数据源

前言 为了满足客户的需求,我们计划将项目中使用的MySQL数据库迁移至H2数据库。虽然项目已经集成了多数据源,理论上可以正常运作,但在实际操作过程中,我们发现项目启动时无法自动创建表。我们将对此问题进行深入分析,并…

211-基于FMC的1路1.5G ADC 1路 2.5G DAC子卡

一、板卡概述 FMC-1AD-1DA-1SYNC是我司自主研发的一款1路1G AD采集、1路2.5G DA回放的FMC、1路AD同步信号子卡。板卡采用标准FMC子卡架构,可方便地与其他FMC板卡实现高速互联,可广泛用于高频模拟信号采集等领域。 二、功能介绍 2.1 原理框图 2.2 硬件…

Java全栈项目 - 校园智慧节能管理平台

项目简介 校园智慧节能管理平台是一个基于Java全栈技术开发的现代化校园能源管理系统。该平台旨在通过智能化手段实现校园能源的精细化管理,提高能源使用效率,降低能源浪费,助力校园绿色可持续发展。 技术架构 后端技术栈 Spring Boot 2.xSpring SecurityMyBatis PlusMySQL…

大模型呼出机器人能够解决哪些问题?

大模型呼出机器人能够解决哪些问题? 原作者:开源呼叫中心FreeIPCC,其Github:https://github.com/lihaiya/freeipcc 大模型呼出机器人作为现代科技在客户服务领域的创新应用,能够解决多个方面的问题,以下是…

【Linux金典面试题(上)】41道Linux金典面试问题+详细解答,包含基本操作、系统维护、网络配置、脚本编程等问题。

大家好,我是摇光~,用大白话讲解所有你难懂的知识点 之前写了一篇关于 python 的面试题,感觉大家都很需要,所以打算出一个面试专栏。 【数据分析岗】Python金典面试题 这个专栏主要针对面试大数据岗位、数据分析岗位、数据运维等…

【深度学习】热力图绘制

热力图(Heatmap)是一种数据可视化方法,通过颜色来表示数据矩阵中的数值大小,以便更直观地展示数据的分布和模式。热力图在许多领域中都有应用,尤其在统计分析、机器学习、数据挖掘等领域,能够帮助我们快速识…