Stable Diffusion是一种生成图像的深度学习模型,其生成过程可以分为几个关键步骤,包括选择模型、输入提示词、设置参数、种子等等。Stable Diffusion文生图的每个步骤和参数都对最终结果有重要影响。
一、选择Stable Diffusion模型
Stable Diffusion模型的选择是生成图像结果的关键因素之一,它决定了最终图像的风格和表现力。选择不同的模型可以影响生成图像的风格、细节和质量。
二、输入提示词
在Stable Diffusion第一个框中输入提示词(Prompt),这些提示词描述了你希望生成的图像内容。提示词的描述可以是任何你希望看到的细节,比如颜色、风格、主题等。有效的提示词能够引导模型生成更符合预期的图像。
三、输入负面提示词
在Stable Diffusion第二个框中输入负面提示词(Negative Prompt),这些词描述了你不希望在生成的图像中出现的内容。通过设置负面提示词,可以避免生成图像中出现不想要的元素或特征。
四、设置参数
Stable Diffusion生成图像的质量和风格受多个参数的影响,包括采样方法、采样步数、图像尺寸等。
1、采样方法/采样器(Sampler)
- Euler:简单快速,适合快速生成图像;
- Euler a:提供更多样化的结果,不同步数可能生成不同的图像;
- DDIM:收敛快,但需要较多步数,适合重绘时使用;
- LMS:Euler 的衍生方法,适用于需要较高准确性的情况;
- PLMS:改进Euler,处理神经网络结构中的奇异性;
- DPM2:改进了DDIM,减少步骤提高速度,适合生成效果好的图像;
- UniPC:效果好且速度快,适用于平面和卡通风格。
2、采样步数(Sampling Steps)
Stable Diffusion采样步数决定了从噪声到目标图像的细化过程。步数越多,图像越精细,但生成时间也会增加。通常建议设置在20至30步之间。
3、CFG Scale(提示词相关性)
调整Stable Diffusion图像与提示词的匹配程度。CFG Scale值越高,图像越贴近提示词,但过高会降低图像质量。通常设置在7至11之间。
4、生成批次(Batch Size)
每次生成图像的组数。一次运行生成的图像数量为“批次*每批数量”。大批次需要更多显存,通常显存不足时保持为1。
5、每批数量(Batch Size Per Batch)
同时生成的图像数量。大批量可以提高效率,但需要更多显存。
6、尺寸(Image Size)
图像的长宽尺寸。较大的尺寸可能导致图像质量下降,建议使用较小的尺寸结合高清修复。
五、种子
种子(Seed)决定了Stable Diffusion生成过程中的随机性,确保在相同参数下生成的图像是可重复的。
六、高清修复
高分辨率修复通过首先生成指定尺寸的图像,然后通过放大算法提高分辨率。常用的放大算法包括 Latent、ESRGAN_4x 和 SwinR 4x。高分辨率修复适用于高质量图像生成。
1、Denoising Strength(降噪强度)
决定放大后的图像与原图的变化程度。值越高,图像越不同于原图。一般设置在 0.3 到 0.7 之间。
2、面部修复(Face Restoration)
修复图像中人物面部的细节,但在非写实风格的图像中使用可能导致面部效果不佳。
七、生成图像
配置好以上参数后,点击“生成”按钮开始生成图像。Stable Diffusion模型会依据设置的提示词和参数生成符合要求的图像。