类型:AI图像生成
简介:利用深度学习和神经网络技术,通过用户输入的文本描述生成高质量的图像。
在使用Midjourney或其他AI图像生成工具时,撰写Text Prompt是很多用户都面临的一个挑战。尤其是当我们希望生成符合特定场景需求的高质量图片时,单纯依赖万能模板往往难以满足预期。为了帮助大家更好地理解如何优化Text Prompt,提高生成图片的质量,本篇将从具体的实战场景出发,探讨如何精确撰写 Prompt。
一、什么是Stock Photo
Stock Photo是指库存图片,通常来自专业摄影师或设计师,并且可以通过一些图库网站购买或下载。由于版权问题,很多 Stock Photo 图片需要付费才能合法使用。这类图片广泛应用于广告、设计、营销等领域,常常可以看到一些经典的场景,比如握手、会议、办公环境等。
对于 AI 图像生成工具来说,生成高质量的 Stock Photo 场景具有较高的挑战性。然而,随着 Midjourney V5 的不断优化,我们已经能够生成非常符合需求的 Stock Photo 场景了。
二、临摹和分析
与学习画画类似,学习如何撰写 Text Prompt 的最佳方法之一,就是通过临摹真实的图片或其他用户生成的图片。在临摹过程中,我们能够理解其中的构图、元素和细节,逐渐形成对场景的掌控。
假设我们想要生成一张经典的「握手」照片,图中包含两个穿西装的亚裔男性在办公楼前握手告别。我们可以从一张真实的图片出发,分析其构图和细节:
1、主体:两个穿西装的亚裔男性,正在握手。
2、背景:办公楼的大门,背景有虚化效果。
3、风格:Stock Photo 风格,照相机拍摄。
4、我们可以将这些元素转化为具体的 Prompt。
然而,Midjourney 生成的结果可能并未完全符合预期。比如,图片可能没有达到我们预想中的背景虚化效果,或焦点偏移了。此时,我们需要回过头来分析,调整 Prompt。
比如,我们可以加入“背景虚化”的关键词,这样可以更明确地告诉 AI 生成我们想要的效果:
stock photo of two Asian men in suits shaking hands, say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh
调整后的结果会更加接近我们的预期,背景虚化和焦点都能得到更好的呈现。
总结:通过临摹和分析真实图片,我们可以逐步掌握如何提炼和组织 Prompt。成功的 Prompt 通常包括以下几个部分:
- 主体描述:你想要的主要元素是什么?
- 背景描述:场景中的环境和位置是什么?
- 焦点描述:你希望突出哪些细节或元素?
- 风格或特殊要求:例如,照片的拍摄方式、虚化效果等。
这种结构化的 Prompt 有助于提高生成图片的质量,并且可以灵活应对不同场景的需求。
- 第一部分(红色线):描述你想要的内容主体;
- 第二部分(蓝色线):描述主体背景/环境;
- 第三部分(黄色线):照片的焦点位置
- 第四部分(绿色线):照片的风格或者说是特殊要求。
三、多实验和控制变量
在生成图片时,遇到不符合预期的情况时,首先不要慌张。可以通过调整不同的参数,逐步接近目标。采用控制变量法,每次只调整一个或两个参数,观察其对生成图像的影响。
例如如果我们去掉 Prompt 中的“stock photo”两个词,会发现生成的图像可能依然符合要求,且手指数量等细节也得到了改善。这样,我们可以得出结论,Stock Photo 这一关键词并不会对模型生成产生很大的影响,因此可以根据实际情况灵活调整。
四、善用Image2Image功能
在某些情况下,我们可能已经有一张接近需求的 Stock Photo 图片,但它的某些细节还需要调整。这时,Image2Image(也叫 Blend)功能就非常有用了。通过此功能,AI 可以在现有图片的基础上进行修改,生成符合你要求的图片。
例如,假设你已经有一张关于握手的 Stock Photo 图片,想要修改其中一只手为非裔手或女性手。你只需要将图片上传给 Midjourney,添加上修改要求,例如:
one African-American hand and one Asian woman hand
AI 将会根据这些要求生成一张符合修改要求的图片。这种方法特别适用于版权问题、内容微调或避免重复使用某些已广泛传播的 Stock Photo。
总结:Image2Image 功能可以大幅提升你在 Stock Photo 场景中的创作效率,尤其适用于那些需要小范围修改或自定义的需求。