Mini-Omni是一个开源的多模态大型语言模型,可以听、说和思考。具有实时端到端语音输入和流式音频输出的对话能力。Github
-
安装 conda
miniconda 安装 -
执行
# 创建一个python环境
conda create -n omni python=3.10
conda activate omni# clone项目
git clone https://github.com/gpt-omni/mini-omni.git
cd mini-omni# 安装依赖
pip install -r requirements.txt# 安装ffmpeg
brew install ffmpeg# 安装PyAudio
brew install portaudio # mac必须
pip install PyAudio==0.2.14# server
python3 server.py --ip '0.0.0.0' --port 60808 --device cpu # 设置 cpu 运行# web ui
# 启动
API_URL=http://0.0.0.0:60808/chat streamlit run webui/omni_streamlit.py
访问 http://localhost:8501/