Hallo部署指南

devtools/2025/2/22 5:38:23/

一、介绍

Hallo是由复旦大学、百度公司、苏黎世联邦理工学院和南京大学的研究人员共同提出的一个AI对口型肖像图像动画技术,可基于语音音频输入来驱动生成逼真且动态的肖像图像视频

该框架采用了基于扩散的生成模型和分层音频驱动视觉合成模块,提高了音频与视觉输出之间的同步精度。Hallo的网络架构整合了UNet去噪器、时间对齐技术和参考网络,以增强动画的质量和真实感,不仅提升了图像和视频的质量,还显著增强了唇动同步的精度,并增加了动作的多样性。

二、部署过程

环境配置基础要求:

系统:Ubuntu22.04系统,

显卡:RTX3090,

显存:24G

1.基础环境

  • 查看系统是否有Miniconda3的虚拟环境

    conda -V
    

    如果输入命令没有显示Conda版本号,则需要安装。

屏幕截图

2.更新系统命令

输入下列命令将系统更新及系统缺失命令下载

apt-get update apt-get upgrade apt-get install -y vim wget unzip lsof net-tools openssh-server git git-lfs gcc cmake build-essential

3.下载模型

输入下列命令对hallo模型进行下载

git clone https://gitclone.com/github.com/fudan-generative-vision/hallo.git

微信截图_20240813170606.png

4.创建虚拟Python环境

  • 创建一个名为"hallo"的虚拟镜像,python版本为3.10
conda create -n hallo python=3.10

微信截图_20240813165913.png

  • 进入"hallo"虚拟环境
conda activate hallo

微信截图_20240813165930.png

5.安装cuda118

使用下列命令下载cuda安装包:

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run

运行cuda:

sh cuda_11.8.0_520.61.05_linux.run

编辑配置文件:

(1)进入文件

vim ~/.bashrc

(2)在 .bashrc添加:

export PATH="/usr/local/cuda-11.8/bin:$PATH" 
export LD_LIBRARY_PATH="/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH"

(3)保存并加载环境变量

source ~/.bashrc

6.下载模型依赖包

输入下列命令:

pip install -r requirements.txt 
pip install .

微信截图_20240814090724.png

下载ffmpeg:

apt-get install ffmpeg

(使用基础命令时已经下载过)

微信截图_20240814090803.png

7.添加模型文件

输入下列命令:

git lfs install 
git clone https://hf-mirror.com/fudan-generative-ai/hallo pretrained_models

微信截图_20240814112152.png

8.运行推理

使用下列命令运行项目呈现模型的成功界面

python scripts/inference.py --source_image examples/reference_images/1.jpg --driving_audio examples/driving_audios/1.wav

微信截图_20240815094136.png

微信截图_20240815094251.png

三、Web界面演示

输入下列命令启动界面:

conda activate hallo cd hallo export GRADIO_SERVER_NAME=0.0.0.0 export GRADIO_SERVER_PORT=8080 python scripts/app.py

微信截图_20240819142849.png


http://www.ppmy.cn/devtools/122741.html

相关文章

如何使用selenium结合最新版chrome爬虫

如何使用selenium结合最新版chrome爬虫 1、下载chrome及其插件chromedriver-win64 点我下载 [百度网盘] 通过百度网盘分享的文件:chrome爬虫插件 链接:https://pan.baidu.com/s/1kqkblX_ordZsQNYR234bMg 提取码:8888 下载后,解压安装。 2、配置电脑系统环境 我的电脑-…

电脑手机下载小米xiaomi redmi刷机包太慢 解决办法

文章目录 修改前下载速度修改后下载速度修改方法(修改host) 修改前下载速度 一开始笔者以为是迅雷没开会员的问题,在淘宝上买了一个临时会员后下载速度依然最高才100KB/s 修改后下载速度 修改方法(修改host) host文…

CI/CD详细流程

CI/CD(持续集成/持续交付或持续部署)是一种软件开发实践,旨在通过自动化软件构建、测试和部署的过程,提高开发效率和软件质量。以下是CI/CD流程的详细说明: 1. 持续集成(CI) 持续集成的核心思想…

玩客云刷派享云教程

玩客云刷机教程 扫描该二维码注册 打开网站(xxxxxxx) 输入你的id 然后点击生成就可以拿到该设备的下载链接(UBOOT) 详细文档:https://www.123684.com/s/WGAwjv-SNlv3 (有不懂看详细文档) 准备⼯作 •⼯具软件&…

【电路基础 · 4】电路的图;KCL、KVL巩固;支路电流法

一、电路的图 1.线性电路的一般的分析方法 2.计算方法 掌握计算方法。 3.支路 branch 和 节点 node 对于支路,经常取电压、电流为同向。 4.KCL 巩固 巩固一下之前学习的 KCL。 但是需要注意: 对于一个电路,如果有 n 个节点,那…

【Android 13源码分析】Activity生命周期之onCreate,onStart,onResume-1

忽然有一天,我想要做一件事:去代码中去验证那些曾经被“灌输”的理论。                                                                                  – 服装…

大模型基础:基本概念、Prompt、RAG、Agent及多模态

随着大模型的迅猛发展,LLM 作为人工智能的核心力量,正以前所未有的方式重塑着我们的生活、学习和工作。无论是智能语音助手、自动驾驶汽车,还是智能决策系统,大模型都是幕后英雄,让这些看似不可思议的事情变为可能。本…

k8s 之常用命令

作者:程序那点事儿 日期:2024/01/30 01:29 route route -n kubectl apply(不存在就创建,存在就更新,执行的文件较小) kubectl apply -f kube-flannel.yml kubectl apply -f nfs-storage-class.yaml ku…