StableDiffusion学习笔记——2、界面介绍

embedded/2025/2/21 7:25:23/

目录
  大家好,我是阿赵。
  继续来学习StableDiffusion的使用。上次讲到了WebUI的使用,下面会继续使用B站秋叶大神的WebUI来学习

一、 启动WebUI

  通过秋叶大神的绘世启动器,点击一键启动按钮:
在这里插入图片描述

  在控制台可以看到运行的情况。
在这里插入图片描述

  我这里有些插件冲突,所以有些报错。在一段时间的等待之后,会发现网页浏览器自己打开:
在这里插入图片描述

二、 界面介绍

1、 顶部栏

在这里插入图片描述

  在网页最上部,有这几个选项:
1. 模型选择
在这里插入图片描述

  秋叶版的StableDiffusion会自带一个sd1.5的anything-v5模型,其他模型是我自己下载的。关于模型下载会在后一篇再说明。
  简单的说,不同的模型会生成出不同效果的图片,有写实的,有卡通的,有国风的,等等。在这个面板里面,可以选择自己想要的模型。
  比如我用anything这个偏向二次元风格的模型生成一只猫
在这里插入图片描述

  会是这样的:
在这里插入图片描述

  我换一个写实的真景写真XL模型
在这里插入图片描述

  在同样的参数和随机种子的情况下,生成出来的猫是这样的:
在这里插入图片描述

2. 外挂VAE模型
  刚才选择的是主模型,这里有一个选择外挂VAE模型的选项:
在这里插入图片描述

  外挂VAE模型和StableDiffusion的大模型是两个概念,VAE模型从通俗的角度说明,它就像是一个滤镜,在生成完图片之后,给图片做调节的,比如可以让颜色更鲜艳,之类。不过如果VAE模型选错了,可能会起反效果。
在这里插入图片描述

3. CLIP终止层数
在这里插入图片描述

  CLIP终止层数的取值范围是1-12。值越小,生成出来的东西越接近我们输入的东西,比如输入的文字,或者原图片。值越大,生成出来的东西就会越发散,可能离我们输入的内容差距越远。
  一般来说CLIP终止层数选择1-2就可以了。

2、 功能选择

在这里插入图片描述

  其中用得最多的是文生图和图生图。
1.文生图
  文生图是通过输入正反提示词,就可以生成一张图片。
在这里插入图片描述

2.图生图
  图生图是可以上传一张图片,然后再输入提示词生成图片。
在这里插入图片描述

  图生图还有一系列的重绘功能,之后单独再介绍。
3.后期处理
在这里插入图片描述

  可以对图片进行放大之类的操作。
4.反推提示词部分
  其中包括
PNG图片信息
在这里插入图片描述

还有WD1.4标签器
在这里插入图片描述

  这两个功能都是可以上传一张图片,然后通过分析图片来获取它的特征,生成提示词用的。

5.模型合并和训练类
  和模型合并或者训练相关的页签有好多个。
  模型合并算是一个常用功能,可以把多个不同的模型合并在一起。但这样的操作往往会让模型产生很多垃圾。至于模型训练,会有更好用的单独训练工具,现在一般也不在StableDiffusion里面训练。
这类功能的页签有:
模型融合
在这里插入图片描述

训练
在这里插入图片描述

模型转换
在这里插入图片描述

超级模型融合
在这里插入图片描述

Dreambooth
在这里插入图片描述

模型工具箱
在这里插入图片描述

6.系统信息
可以看到当前运行的系统的信息
在这里插入图片描述

7. 无边图像浏览
这个功能非常有用,可以查询到之前曾经生成过的图片,还可以把生成的图片的参数复制和发送到各个功能:
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

8. 设置
  包含当前的各种设置选项:
在这里插入图片描述

9. 扩展
  这里是管理扩展插件的地方,可以看到已经安装的插件,还可以直接找到可以下载的插件
在这里插入图片描述

3、 提示词

  正向提示词和反向提示词部分。提示词功能会在之后再介绍
在这里插入图片描述

4、 生成部分

  可以调节生成参数,并看到生成出来的图片
在这里插入图片描述

5、 插件部分

  生成一张图片,除了使用正反向提示词、生成参数之外,还可以通过各种插件控制效果,比如很常用的ControlNet。这部分之后会单独介绍。
在这里插入图片描述


http://www.ppmy.cn/embedded/162304.html

相关文章

LINUX——内核

引言 Linux 内核(Kernel)是操作系统的核心,负责管理计算机的硬件资源并为用户空间程序提供基础服务。它是 Linux 生态的“心脏”,驱动着从嵌入式设备到超级计算机的各类系统。理解 Linux 内核的设计原理和核心机制,是…

Vue全流程--Vue3组合一ref与reactive(实现响应式)

ref&#xff1a;定义基本类型的响应式数据 先看ref使用的位置 <script > import {ref} from vue export default {name: App,setup(){//数据let name ref(张三)let age ref(18)//方法function changeInfo(){// name 李四// age 48console.log(name,age)}//返回一个…

KaiOS 4.0 APN List 界面加载debug

问题背景 在列表选中APN进入编辑后,退出返回列表界面时无法焦点选中编辑的APN。 代码分析 路径:gaia/apps/settings/js/panels/apn_list/panel.js 分析SettingsPanel界面加载的步骤逻辑 onBeforeShow -> onShow -> onBeforeHide -> onHide return SettingsPanel(…

Unity-Mirror网络框架-从入门到精通之PickupsDropsChilds示例

文章目录 前言示例介绍PickupsDropsChildsSceneObject最后前言 在现代游戏开发中,网络功能日益成为提升游戏体验的关键组成部分。本系列文章将为读者提供对Mirror网络框架的深入了解,涵盖从基础到高级的多个主题。Mirror是一个用于Unity的开源网络框架,专为多人游戏开发设计…

Github 2025-02-12 C开源项目日报 Top7

根据Github Trendings的统计,今日(2025-02-12统计)共有7个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量C项目7Python项目2OpenSSL - 强大的开源加密工具包 创建周期:4012 天开发语言:C协议类型:Apache License 2.0Star数量:23449 个Fork数量:10…

DeepSeek模型架构及优化内容

DeepSeek v1版本 模型结构 DeepSeek LLM基本上遵循LLaMA的设计&#xff1a; 采⽤Pre-Norm结构&#xff0c;并使⽤RMSNorm函数. 利⽤SwiGLU作为Feed-Forward Network&#xff08;FFN&#xff09;的激活函数&#xff0c;中间层维度为8/3. 去除绝对位置编码&#xff0c;采⽤了…

【SpringBoot3.x+】slf4j-log4j12依赖引入打印日志报错的两种解决方法

最开始引入了1.7.5版本的slf4j-log4j依赖包&#xff0c;但是控制台不报错也不显示日志 在https://mvnrepository.com/找到最新的2.0.16版本之后出现报错&#xff1a; 进入提示的slf4j网站中可以找到从2.0.0版本开始&#xff0c;slf4j-log4j已经被slf4j-reload4j取代&#xff1…

web渗透测试之反弹shell SSRF结合redis结合伪协议 redis 未授权访问漏洞

目录 未授权访问漏洞利用:redis 反弹shell 漏洞原因就是&#xff1a; 反弹shell利用方式 反弹shell指的是什么 : 反弹shell的前提条件 步骤: redis未授权访问的三种利用手段反弹shell 利用定时任务反弹shell 攻击主机下设置 写入 webshell 步骤 利用公钥认证写入ro…