2024年最新Stable Diffusion 新手入门教程,安装使用及模型下载

news/2025/1/8 15:36:52/

一、安装要求:


操作系统:Windows10以后的系统

② CPU:不做强制性要求

③ 内存:推荐8G以上

④ 显卡:必须是Nvidia的独立显卡,显存最低4G,推荐20系以后;A卡、核显只能用CPU跑

⑤ 整合包推荐放在固态硬盘中,提升模型加载速度

如何查看自己电脑性能:

同时按下 Ctrl+Alt+Delete 三个键(或鼠标右键底下的任务栏),选择任务管理器
在这里插入图片描述

二、下载安装

推荐下载b站秋葉大佬的整合包:文末会分享

安装启动器运行依赖,双击启动器运行依赖一步步安装即可。

解压整合包本体到空间比较大的分区,最好是固定硬盘中,不要安装到中文路径下

解压完后双击启动器就可以运行了,如果开着全局梯子请注意关闭

在这里插入图片描述

三、通过启动器进入web界面

启动器一览

在这里插入图片描述
打开启动器,一键启动即可,留意随启动器一起打开的命令窗口,等待一会显示http://127.0.0.1:7860就成功启动了,若启动时有什么报错信息都可以在这个窗口看到,可以尝试用启动器的修复功能先修复看看,如果不行先百度下看看,实在解决不了可以进秋葉大佬的QQ频道咨询一下。
在这里插入图片描述
一般会自动打开网页进入绘图页面,文生图最基本的介绍看下图

在这里插入图片描述
① Stable Diffusion 模型:切换大模型,出什么类型的图主要看这个

② 模型的VAE:VAE模型,主要作用就是滤镜和微调画面,常用的是840000

③ 跳过CLIP层数:数值越小其越贴近模型表现,通常为2不需要动

④ 正向提示词:想要生成的内容

⑤ 反向提示词:画面中不想要的内容

⑥ 迭代步数和采样方法是配套的,生成人物图建议使用DPM++ 2S a采样方法,迭代步数保持在25~30之间。过低过高都不会太好。

⑦ 宽高:一般方图512 512即可,竖图和横图可以保持一边512另一边等比例计算即可,如512 912

⑧ 高清修复:放大处理,想生成大图,分辨率调小+启用高清修复

⑨ 生成批次:一次想生成多少张图片

⑩ 每批数量:一般保持1不要动,极消耗显存

⑪ 提示词引导系数:提示词与画面的相关程度,一般7-10

四、使用提示词生成自己的第一幅图

1、正向提示词的内容通常包含人物、场景、环境、视角以及画面品质和画风等基本元素组成

在这里插入图片描述在这里插入图片描述

在这里插入图片描述
2、提示词的权重,想突出或减弱的画面内容可以使用提示词权重来控制,推荐直接使用小括号:数字的组合,高于1是增加权重,低于1是减少权重,如:

增加权重:(white flower:1.5) 会增加白色的花在画面中出现的概率和画面占比

减少权重:(white flower:0.5) 会减少白色的花在画面中出现的概率和画面占比
在这里插入图片描述
3、反向提示词:通常是放不希望出现在画面中的内容,好比描写下雨的场景AI总会把伞画进去,此时就可以把伞相关的词放入这里。反向提示词通常是可以直接抄作业的。如下面这个画人时通常使用的模板:

NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal
quality, ((grayscale)), skin spots, acnes, skin blemishes, age spot,
(ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21),
(tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad
anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331),
(missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many
fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers,
extra digit,bad hands, missing fingers, (((extra arms and legs))),

4、如何来写提示词:因为SD对中文的识别不太友好,所以也是需要输入英文提示词来生成画面,这里提供3种方法供参考。

① 翻译大法:使用翻译软件把中文提示词翻译成英文,常用工具有DeepL、谷歌翻译、百度翻译等

② 提示词生成工具:用一些提示词生成工具可以依次选择需要的词,然后直接拷贝进去即可。常用的工具有:


直接抄作业:很多网站提供了预览图和完整的提示词,可以直接拷贝过来用,当然要想出跟提示词相似的图片还要留意下使用的基础模型、Lora模型及采样步数等相关参数。相关网站有:

大名鼎鼎的C站:https://civitai.com/(现在这个网站需要梯子才能打开了,这也是主要的模型下载站,模型下面除了模型作者的演示图也会有网友创作的图,大多带有提示词可以参照)

Lexica:https://lexica.art/(虽然图库是他自家的模型,但是提示词一样很有参考价值)

5、生成第一张图吧

正向提示词我们就用:1girl, long hair, long skirt, indoors, morning, upper body, best
quality, 8k

反向提示词就用上面给到的,分别填写到对应的输入框,生成自己的第一张图吧。其他参数也可以参考下图设置

在这里插入图片描述
可以把总批次设置成4就可以一次生成4张图片了
在这里插入图片描述
好像还不错?但是为啥生成的都是动漫风格的呢?那是因为我们默认使用的是anyting这个大模型主要就是生成动漫风格的。而Stable
Diffusion非常依赖模型来生成不同的风格。

这里直接将该软件分享出来给大家吧~

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述


http://www.ppmy.cn/news/1561282.html

相关文章

Python爬虫基础——认识网页结构(各种标签的使用)

1、添加<div>标签的代码定义了两个区块的宽度和高度均为100px&#xff0c;边框的格式也相同&#xff0c;只是区块中显示的内容不同&#xff1b; 2、添加<ul>和<ol>标签分别用于定义无序列表和有序列表。<il>标签位于<ul>标签或<ol>标签之…

轻量级适合阅读的优秀 C++ 开源项目

CTPL 这是一个现代简易版的、高效的C线程池库&#xff0c;代码行数500行左右。 代码示例&#xff1a; void first(int id) { std::cout << "hello from " << id << \n; } struct Second { void operator()(int id) const { std::cout << &q…

《Vue进阶教程》第三十五课:自动脱ref

往期内容&#xff1a; 《Vue进阶教程》第二十四课&#xff1a;优化 《Vue进阶教程》第二十五课&#xff1a;watch基本概念 《Vue进阶教程》第二十六课&#xff1a;实现侦听函数 《Vue进阶教程》第二十七课&#xff1a;实现侦听对象 《Vue进阶教程》第二十八课&#xff1a;…

Dart语言的数据结构

Dart 语言中的数据结构 Dart 是一种现代化的编程语言&#xff0c;广泛用于构建高效、逻辑清晰的移动、Web 和服务器端应用程序。作为一种面向对象的语言&#xff0c;Dart 提供了一系列强大的数据结构&#xff0c;帮助开发者更高效地管理和操作数据。在本文中&#xff0c;我们将…

数字化转型 · OCR 技术如何打破效率瓶颈?

引言 伴随着全球电商和供应链业务的快速发展&#xff0c;物流管理面临着越来越复杂的挑战**。高效、准确地进行仓储管理、商品识别、入库和出库操作&#xff0c;已成为提升物流效率和降低成本的关键。**传统的物流管理方式主要依赖人工操作和纸质单据&#xff0c;不仅效率低下…

C++语言的网络编程

C语言的网络编程 引言 随着互联网的迅猛发展&#xff0c;网络编程已成为软件开发的重要组成部分。C作为一种高效的编程语言&#xff0c;因其出色的性能和灵活性&#xff0c;广泛应用于网络编程领域。本文将介绍C网络编程的基本概念、常用的网络库&#xff0c;以及一些具体的应…

动态规划六——两个数组的dp问题

目录 题目一——1143. 最长公共子序列 - 力扣&#xff08;LeetCode&#xff09; 题目二——1035. 不相交的线 - 力扣&#xff08;LeetCode&#xff09; 题目三——115. 不同的子序列 - 力扣&#xff08;LeetCode&#xff09; 题目四—— 44. 通配符匹配 - 力扣&#xff08;…

NoSQL——期末复习(5)第五章Neo4J重点思考题

什么是Neo4j&#xff1f;并对其数据模型进行详细描述。 Neo4j是一个基于Java语言的开源图数据库系统。Neo4j具有强大的图处理和查询搜索能力&#xff0c;通过专用的Cypher语言完成各类操作。 Neor4j采用将数据存储为节点和边的图存储模式&#xff0c;其中节点表示实体、边表示…