AIGC提词生成图片(人物照片)练习笔记

news/2024/11/22 18:18:17/

文生图, 图生图 等 AIGC 创作大火, 也来体验一下吧.
本文记录了环境搭建过程与使用心得. 如果动手能力弱或只想省心, 有

环境要求

列出来我的环境吧:

  • CPU, AMD Ryzen 7 5800X 8-Core Processor
  • RAM, 32G
  • GPU, NVIDIA GeForce RTX 2070 SUPER (8G)
  • OS, Windows 11 专业版
  • 开发环境, python, 3.10 与 git .

一. stable-diffusion-webui 安装

拉 git 仓库, git clone git@github.com:AUTOMATIC1111/stable-diffusion-webui.git 或直接下载 zip 文件.

构建环境

进入项目目录(stable-diffusion-webui), 运行 webui.bat (linux 为 webui.sh). 它会作很多搭建动作:

  1. 会创建 venv 虚拟环境, 安装 torch, numpy 等三方包, 位于 stable-diffusion-webui\venv\Lib\site-packages 中.

  2. 安装 github.com/TencentARC, github.com/openai/CLIP.git, github.com/mlfoundations/open_clip.git 等至 stable-diffusion-webui\venv\Lib\site-packages 中. 虽然也是 pip install , 但

     RuntimeError: Couldn't install gfpgan.
    Command: "D:\code_third_party\stable-diffusion-webui\venv\Scripts\python.exe" -m pip install git+https://github.com/TencentARC/GFPGAN.git@8d2447a2d918f8eba5a4a01463fd48e45126a379 --prefer-binary
    stderr:   Running command git clone --filter=blob:none --quiet https://github.com/TencentARC/GFPGAN.git 'C:\Users\yichu\AppData\Local\Temp\pip-req-build-wo324g05'Running command git rev-parse -q --verify 'sha^8d2447a2d918f8eba5a4a01463fd48e45126a379'Running command git fetch -q https://github.com/TencentARC/GFPGAN.git 8d2447a2d918f8eba5a4a01463fd48e45126a379fatal: unable to access 'https://github.com/TencentARC/GFPGAN.git/': Failed to connect to github.com port 443 after 21054 ms: Couldn't connect to servererror: subprocess-exited-with-error
    

    出现该报错的原因看起来是网络通信. 我的解决办法是, 把命令 git clone --filter=blob:none --quiet https://github.com/TencentARC/GFPGAN.git 'C:\Users\yichu\AppData\Local\Temp\pip-req-build-wo324g05' 复制出来, 将 https:// 子串改成 git@, 换成SSH通信, 然后单独执行. 再然后继续从头执行 webui.bat , 它会跳过已经就绪的步骤, 不用担心完全从头开始.
    tips: 要用ssh, 需要先登录 github 并把 SSH keys 添加到个人账户设置页中去.

  3. 拉取 [BLIP, CodeFormer,k-diffusion,stable-diffusion-stability-ai,taming-transformers] 几个 git 项目至stable-diffusion-webui\repositories\ 目录下. 注意这里不是 pip install, 而是直接拉仓库, 拉下来后各自目录下均有 .git 子目录. 见下:

    在这里插入图片描述

放入sd模型

推荐使用参考[2] 的模型, 下载其 ckpt 资源, 约4GB.
在这里插入图片描述

二. 运行 web-ui

在这里插入图片描述

参考

1.Bilibili 视频, 免部署整合包介绍
2. huggingface, stable-diffusion-v-1-4-original


http://www.ppmy.cn/news/57141.html

相关文章

【pyTorch学习笔记④】PyTorch基础·中篇

文章目录 三、Numpy与Tensor3.Tensor的索引4.Tensor的广播机制5.逐元素操作6.归并操作7.比较操作8.矩阵操作9.PyTorch与Numpy的比较 相关推荐 三、Numpy与Tensor 3.Tensor的索引 (1)item:若Tensor为单元素,则返回标量&#xff0…

机器学习算法原理:详细介绍各种机器学习算法的原理、优缺点和适用场景

目录 引言 二、线性回归 三、逻辑回归 四、支持向量机 五、决策树

使用docker容器化部署mysql8.0.27,并更改其默认端口3306为3306全流程记录。

使用docker容器化部署mysql8.0.27,并更改其默认端口3306为3306全流程记录。 1.创建镜像 #查看镜像 docker images|grep mysql #搜索镜像 docker search mysql #拉取镜像 docker pull mysql:latest #运行镜像,--name 后的参数自己命名,我的数…

【MFAC】基于全格式动态线性化的无模型自适应控制

来源:侯忠生教授的《无模型自适应控制:理论与应用》(2013年科学出版社)。 👉对应书本 3.4 单输入单输出系统(SISO)全格式动态线性化(FFDL) 和 4.4 单输入单输出系统(SISO)全格式动态线性化(FFDL)的无模型自适应控制(MF…

命令行 控制 易微联 wifi通断器

有个设备需要远程控制开关,最简单的方式就是通过一直在线运行的 Pi,进行命令行控制智能开关。 1、材料准备 找个最便宜的智能开关,话说易微联的做的真是便宜,销售量也很大。 这种 网上叫 Wifi通断器,或者智能开关&a…

音视频八股文(8)-- h264 AnnexB三层结构

NALU(Network Abstract Layer Unit) ⾳视频编码在流媒体和⽹络领域占有重要地位;流媒体编解码流程⼤致如下图所示: H264简介 H.264从1999年开始,到2003年形成草案,最后在2007年定稿有待核实。在ITU的标准⾥称为H.264&#xff0c…

Vue(简单了解Cookie、生命周期)

一、了解Cookie 类似于对象响应携带数据 输入用户名密码跳转到指定页面 点击指定页面中其中一个按钮跳转到另一个指定页面(再不需用输入用户名密码) 例如现在很多浏览器实现七天免密登录 简单理解:就是在网站登录页面之后,服务…

Shiro相关知识

1、Shiro功能概述 Apache Shiro是一个功能强大且易于使用的 Java 安全框架,可执行身份验证、授权、加密和会话管理。 主要功能: Authentication:身份认证。登录时验证身份信息。 Authorization:授权操作。访问控制的过程&…