Midjourney|文心一格prompt教程[Text Prompt(下篇)]:游戏、实物、人物、风景、动漫、邮票、海报等生成

举报
汀丶 发表于 2023/05/18 11:51:57 2023/05/18
【摘要】 Midjourney|文心一格prompt教程[Text Prompt(下篇)]:游戏、实物、人物、风景、动漫、邮票、海报等生成,终极模板教学

Midjourney|文心一格prompt教程[Text Prompt(下篇)]:游戏、实物、人物、风景、动漫、邮票、海报等生成,终极模板教学

场景6:游戏

Prompt 真的越长越好吗?

按照 Midjourney 的官方文档里的说法,并不一定:

Prompts can be very simple. Single words (or even an emoji!) will produce an image. Very short prompts will rely heavily on Midjourney’s default style, so a more descriptive prompt is better for a unique look. However, super-long prompts aren’t always better. Concentrate on the main concepts you want to create.

但你会发现,好像中文社区分享的 prompt 都非常长,但只要各位仔细观察,或者用翻译软件查一查,你会发现很神奇的事情:

  1. 有一些词拼写错误。原因是某书,不支持复制黏贴,导致很多人 OCR prompt,然后识别错误,大家都在搬运 prompt ,导致错误一直传递,这也算是新时代的水印了吧。
  2. 有一些词非常重复,比如 8k、UHD、Ultra Quality,他们都在说一个事情,就是高清,加多了也不会有叠加作用。
  3. 很多词你根本不知道为啥需要,但好像每个人都加了。比如 8K 这些词,你有想过这个词是有必要的吗?是有用的吗?但实际上这些词官方并不推荐使用,这些词甚至对你的图会造成破坏(详见 Midjourney 官方 FAQ 一章)。

如果你看完我的教程,你会发现我讲的例子里,很多图只要很少的 prompt 就能描述清楚,生成的图片也不差。

当然我并不是说,不能写很长的 prompt,如果你生成的内容本来就很复杂,那写长一点也没所谓,但写完问问自己,这有必要吗?

像素游戏

说到游戏,我最喜欢的风格是像素风,像素风格一般有:

  • 8-bit
  • 16-bit
  • 32-bit

各位都可以自己试试,介绍一个我写的 prompt,最近塞尔达发布了最新作《王国之泪》,很喜欢他们的天空岛的设定,所以用 Midjourney 生成了一个 16-bit pixel art 版本:

Prompt 解释
类型是什么? 16-bit pixel art 16 bit 风格
主体是什么? island in the clouds, ancient ruins 天空岛,岛上有遗迹
背景是什么? null 主题描述里其实已经有背景了(clouds),所以我就没重复写
构图是怎样的? null 不太重要,就让 AI 自由发挥
用什么镜头? null 不太重要,就让 AI 自由发挥
是什么风格? Zelda style 因为是复刻塞尔达,所以加了塞尔达风格
参数 null 没有加任何参数

再生成一个宠物小精灵的场景:

Prompt 解释
类型是什么? 8-bit pixel art 换成了更复古的 8 bit 风格
主体是什么? types of Pokémon 我想让 AI 生成宠物小精灵图谱一样的内容

这两个 prompt 都很短,但很有意思,可玩性挺强的,各位可以多玩玩:

MJ047.png

3D 游戏——场景

因为篇幅的原因,我无法将所有有关 3D 游戏的 prompt 都介绍完,我只能挑选一些我比较喜欢的风格讲一下,而且我不是专业的 3D 设计师,所以未免会有讲错的地方,望见谅。

在 3D 场景设计里,我最喜欢的应该是像素风 3D 微缩场景,也不知道是不是叫这个名字😂,写一个 prompt 给大家看看:

Prompt 解释
类型是什么? isometric clean pixel art 这个风格我是问了 ChatGPT 的,不确定是不是叫这个。
主体是什么? robotics lab 机器人实验室
背景是什么? null 不太重要,就让 AI 自由发挥
构图是怎样的? null 不太重要,就让 AI 自由发挥
用什么镜头? null 不太重要,就让 AI 自由发挥
是什么风格? null 我在类型里提了,所以不需要重复强调
参数 null 没有加任何参数

以下左图是火星工厂,右图是机器人实验室:

MJ065.png

3D 游戏——人物

主体描述我就不多说了,更多是分享 3D prompt 的必要的要素:

Prompt 解释
类型是什么? blender 3d 我测试了下,只写 3d 也行,但不知道为啥没那味,加了 blender(一个 3D 建模软件)就会好很多。
主体是什么? Dark Vader, full body, cute 达斯维达的全身像,然后我希望它生成一个 Q 版的
背景是什么? null 不太重要,就让 AI 自由发挥
构图是怎样的? isometric 等轴侧投影,这是一种用二维平面呈现三维物体的方法,效果可以看后面生成的图片,各位就知道是啥了。
用什么镜头? null 不太重要,就让 AI 自由发挥
是什么风格? Pixar, style of artstation 我这里加了皮克斯风格,以及跟之前讲插画的那章加了 behance 类似,加了 artstation 后效果有变好(artstation 跟 behance 类似,也是设计师分享作品的一个网站,但主要分享 3d 或游戏相关的内容)
参数 null 没有加任何参数

我用以上 prompt 生成了达斯维达和风暴兵的,我觉得风暴兵还挺可爱的:

MJ048.png

3D 游戏——装备

游戏装备非常非常多,我没法一一给大家介绍,只介绍一些我了解的,首先是戒指,多大数的游戏戒指都是那种印章戒指(signet ring),

Prompt 解释
类型是什么? blender 3d 这个可加可不加
主体是什么? star war, signet ring 星球大战的印章戒指
背景是什么? null 不太重要,就让 AI 自由发挥
构图是怎样的? isometric 等轴侧投影(这个可加可不加)
用什么镜头? null 不太重要,就让 AI 自由发挥
是什么风格? null 不太重要,就让 AI 自由发挥
参数 null 没有加任何参数

另外一个可能常见的是装备集(我不确定这个中文是否正确,英文叫 Item Collections),写法是这样的:

Prompt 解释
类型是什么? blender 3d, game sheet game sheet 简单说是那种游戏设定图,一般就是罗列各种装备
主体是什么? lightsabers, paladin armor, 希望生成一些列的星球大战的光剑和圣骑士盔甲
背景是什么? null 不太重要,就让 AI 自由发挥
构图是怎样的? null 类型包含了,所以不用填
用什么镜头? null 不太重要,就让 AI 自由发挥
是什么风格? style of Hearthstone 我很喜欢炉石传说的风格,也很好奇,中古风格,遇上未来题材,会生成怎样的设计
参数 null 没有加任何参数

最后生成的结果如下,但我对装备集的生成不是很满意,后面我会介绍一个技巧,教大家如何渐进优化生成的图片:

MJ050.png

技巧十:控制变量法渐进优化

很多人把 AI 生成图片比喻为炼丹,我觉得非常贴切,很多时候,也不知道为啥,在 prompt 里加一点神秘配方,图片就会很不一样。

不过我觉得虽然过程很像炼丹,但并不代表我们需要像古人那样,用撞大运的方式炼制丹药。我认为目前使用 Midjourney 最好的方法是:控制变量渐进优化法。

拿上面那个装备集的图片为例,我希望它生成的是装备,并且是一件件地排布,而且光剑的效果也很奇怪,首先我们来逐条排查 prompt:

Prompt 检查
类型是什么? blender 3d, game sheet 这个好像有点问题,我希望的炉石传说的风格,好像不是这种精致的 3D 效果,生成的风格更像是星际争霸的,而炉石传说是那种黏土风格(clay render)。
主体是什么? lightsabers, paladin armor, 这里可能也有问题,会不会是没有写 different types of lightsabers 导致只生成一种光剑。
背景是什么? null 这个应该没啥问题
构图是怎样的? null 这个应该没啥问题
用什么镜头? null 这个应该没啥问题
是什么风格? style of Hearthstone 感觉生成的图没有那种中世纪盔甲的油腻感,但如果前面改了黏土风格,会不会好一些?这里可能也需要优化下。
参数 null 这个应该没啥问题

从这个表里可以看到,我们发现了三个问题,其中第一个黏土风格问题,跟最后一个问题有关,此时我的建议是:

  1. 每次仅修改一个,其余变量不变。
  2. 修改完一条,效果符合预期后,再修改下一个。
  3. 我的经验优先修改主体内容,因为主体有的时候会影响其余的变量。
  4. 如果想确定这个修改是否具有一致性,或者说是否符合要求,而不是恰巧符合,可以用相同的 prompt 再生成一次。不过因为没生成一次都要花钱,所以这个是可选项。

OK,按照以上原则,我们修改一下我们的 prompt,看看生成了什么,的确加了 different types of 后,光剑就多了,问题解决了:

MJ051.png

然后我们修改下 blender 3d,将其改为 clay render (黏土渲染),我改完之后发现生成的结果(左边四张),好像质感还是差了一点,于是我又试了下保留 3d blender 加 oily 的效果(中间四张),以及 clay render 加 oily 两个一起用(右边四张)。

MJ052.png

我个人觉得好像两个都改了效果是最好的(右边四张)。

对比一下最开始的 prompt 生成的图片,是不是最终的图片效果更好?所以这个技巧主要想告诉大家,写 prompt 没有必要照抄答案,你也有能力自己写好 prompt。

游戏设定稿

游戏这一章,再介绍一个可能会用到的一个场景人物设定稿,prompt 如下:

Prompt 解释
类型是什么? concept design sheet 设定稿
主体是什么? female paladin, character design, 生成一个女性圣骑士的角色设定
背景是什么? white background 设定稿一般都是白底的
构图是怎样的? null 类型包含了,所以不用填
用什么镜头? null 不太重要,就让 AI 自由发挥
是什么风格? null 因为我对游戏相关的风格和设计师都不熟悉,所以就让 AI 自由发挥了
参数 null 没有加任何参数

最后的结果如下:

MJ056.png

场景7:实物

让 ChatGPT 生成提示词是不是更好?

我有用 ChatGPT 辅助我生成提示词,但没有用 Role 模式,而是让它:

  1. 翻译:我知道我想要的东西,但不知道其英文描述。
  2. 解答:我需要一些风格词,但我不知道输入啥时,就会问 ChatGPT ,比如「文艺复兴时期的著名艺术家有哪些?」

我为何没有用 Role 模式?

的确,让 ChatGPT 以 Role 模式帮我生成内容,比较省时省力,但我个人觉得:

  1. 使用比较麻烦,需要输入很多提示,即使通过 App 保存,在多次输入后,就会超过 token 限制,又要重新输入。
  2. 从 ChatGPT 的原理上看,它只会生成一个「普通」的内容,很难获得超过预期的内容。只是说大多数人甚至连「普通」都达不到,所以才会震惊于它的效果。所以如果你想要生成原创惊艳的图,靠概率是不行的,要靠你的想象力。

不过,这也是我一家之言,如果你觉得这样效率更高,那就用吧~

没啥关系,适合自己的工具才是好工具。

玩具

OK 言归正传,从本章开始,我们会逐步丰富我们的 prompt 框架,让图片有更多的细节。实物生成的第一个是场景是玩具,是个非常有意思的场景。

另外,这个场景如果能跟 3D 打印机结合一下,我觉得会非常赞。不知道有没有有志之士能实现一下。

再解释下 prompt 有哪些更新,从实物这张开始,我讲「背景」调整为「环境」,即主体环境,包括背景、灯光等等:

Prompt 解释
类型是什么? product photography 产品照片
主体是什么? Stormtrooper, plastic, toy 继续用风暴兵和达斯维达为例。因为手办一般都是塑料玩具,所以加了两个词
环境是怎样的? white background, studio lighting 背景:为了突出手办,强调一下白色背景 灯光:增加一些灯光,突出产品
构图是怎样的? null 不太重要,就让 AI 自由发挥
用什么镜头? null 不太重要,就让 AI 自由发挥
是什么风格? hand painted, 我查了下,好像手办的风格应该只有手绘?

另外一个是游戏王里的蓝眼白龙,可惜 Midjourney 并不知道啥是 Yu-Gi-Oh,只能按字面意思生成了一个:

Prompt 解释
主体是什么? Blue-Eyes White Dragon, plastic, toy 继续用风暴兵和达斯维达为例。因为手办一般都是塑料玩具,所以加了两个词

以下是生成的图片:

MJ066.png

另外,我发现 Midjourney 对美式动漫或电影作品支持会好很多,比如冰与火之歌里的龙妈(只是龙有点诡异),还有圣女贞德:

MJ067.png

技巧十一:增加风格——国家

说到手办,大家应该第一反应会想起日本,再介绍一个技巧,在 prompt 里加入 Japanese style 即可,拿圣女贞德作手办,以及之前做的 logo 作为例子:

MJ068.png

圣女贞德是不是有种 FF 的感觉?Logo 也比较简洁,猫的外观也有点像动漫里猫的外观,当然除了 Japanese 还有 Chinese(左边4张),甚至 African Style:

MJ070.png

技巧十二:增加权重

各位有没有发现,上面那个 Chinese 手办生成的结果好像只有第三张是中国人面孔?原因是 Chinese style 的权重太低,所以仅输出了一个结果。你在实践的过程中,也肯定会遇到,AI 忽略了某些 prompt 词的情况,比如你提到画面中要有一只鸟,但它就是没画出来。

那为何会产生这样的结果?原因 Midjourney 的 prompt 权重是按照顺序逐个降低(详情请见我翻译的 Midjourney 官方 FAQ),在我们上面的 prompt,我们将 Chinese Style 放到了最后,所以生成的结果也是最少的。忽略了某些词,这个原因暂时为止,但应该很可能是权重导致的问题。

增加权重的方法有很多,最简单的方法就是调整顺序,比如将上面的 Chinese Style 放到最前面(然后生成的结果就是眯眯眼 style 了 🤣,我生成了两次,第二次好一些):

product photography, Chinese Style,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting

调整下顺序,效果就大不一样,所以各位不要迷信所谓的 prompt 模板,多试试。

MJ071.png

第二种方法是 Slider 方法。

你需要在 prompt 最后加 ,然后加上你需要调整权重的词语,接着再加 ,最后加上权重值。比如还是上面的例子,我想突出 Chinese style 但不想调整顺序,就可以改为:

product photography,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting, Chinese Style :: Chinese Style :: 0.5

然后你会发现,好像权重太高了,生成了跟 prompt 无关的图(下方左图),那我们可以在原来的基础上,再加以下 Joan of Arc 的权重(下方右图):

product photography,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting, Chinese Style :: Joan of Arc:: 0.25 style of Chinese:: 0.5

你可以看到,调整参数后,生成的 4 张图有 2 张具备较强的 Chinese 风格:

MJ072.png

不过坦率说来,这个方法,并不特别适合这个案例,调整主体内容,或者顺序, ROI 会更高一些,这个方法更适合 miss 掉某个 prompt 词时使用,比如官方的案例是这样的:

several sad cats watch a crying woman in a home-office environment with laptop

生成的图片里(左四张图),猫咪们都看着你(你可能才是 crying woman 😂),如果用 slider 的功能(右边四张),crying woman 就出现在画面里了:

several sad cats watch a crying woman in a home-office environment with laptop:: several sad cats::0.5 crying woman::0.6 laptop::0.7

另外需要注意,slider 可用的参数有 0.25、0.5、0.6、0.7,也可以用这个方法降低权重,区间是 -0.7、-0.6、-0.5、-0.25:

MJ073.png

如果你用了 slider 还是没有出现应该有的画面,那还有一个大招 cowbell,坦率说来,这个并不符合 Midjourney 的官方最佳实践,但的确是个可行的方法,以下面这个 prompt 为例,生成的图片里,woman 看起来并不 shy(左边四张图):

A songbird sits on the shoulder of a shy blonde woman dressed in white.

此时你可以重复重复再重复(我觉得这就是为何这个方法叫 cowbell 的原因):

A songbird sits on the shoulder shoulder shoulder shoulder shoulder shoulder of a shy shy shy shy shy shy shy blonde woman dressed in white.

MJ074.png

食物

另一个我比较喜欢的实物是食物,食物讲究的是「色香味俱全」,所以在描述食物类的 prompt 时,可以往这三个方向想想:

  • 色:食物是什么颜色的(可以通过食物的熟度来控制)。
  • 香:照片没有香味,但我们可以把香气画出来。
  • 味:照片也同样没有味道,那我们加一点细节装饰?比如撒上胡椒、盐、辣椒?
Prompt 解释
类型是什么? food photography 食物照片
主体是什么? steak, medium rare, steaming, light garnishes, sitting on plate 牛排,五分熟,带蒸汽,仅有一点配菜,放在一个碟子上
环境是怎样的? epic lighting 为了突出食物,我加了个聚光灯
构图是怎样的? null 不太重要,就让 AI 自由发挥
用什么镜头? depth of field 为了突出食物,我加了背景虚化,这是背景虚化的另一种表达(有景深)
是什么风格? null 不太重要,就让 AI 自由发挥
参数 null 没有加任何参数

然后再来一碗红烧牛肉面:

MJ075.png

技巧十三:善用灯光

坦诚地跟大家说,我不是设计师,也不是摄影师(而且我非常不擅长摄影),所以我仅能跟大家分享一下基础内容,因为这个对我来说,太多过程性知识了,不实际操作过,根本不知道有什么。

言归正传,摄影中,常用摄影灯光有以下几种:

  1. 主灯 (Key Light):主灯是最基本的摄影灯光之一,通常放置在被拍摄物体的正前方或正侧方,用于照明主体,决定拍摄物体的主要明暗度。主灯通常是亮度最高的灯光。
  2. 填光灯 (Fill Light):填光灯用于弥补主灯照射的阴影部分,调整阴影的深浅程度,使照片明亮一些。通常填充光应该比主光暗一些,以避免出现过度曝光。
  3. 逆光灯 (Back Light):逆光灯用于照射被拍摄物体的背面,能够区别出主体和背景,并使物体轮廓变得清晰,常用于拍摄骨感、重物感和逆光效果的照片等。
  4. 环境光 (Ambient Light):环境光就是摄影环境自然产生的光线,包括室内照明、自然光、街灯等,它可以补充被拍摄物体的表面,提升照片的自然度和真实感。
  5. 故事性灯光 (Special Light):通常是为了制造出某种情境或者表达某种意义而使用的,例如烛光、亮光等。它们能够产生温暖、浪漫、神秘等场景和气氛,以探索和表达艺术的想象力和创造力。

基于这些灯进行排列组合,你会得到不同使用场景的灯光。灯光的细节种类,可以去我归纳的 Lighting List 里查看,我这里主要分享一些常用和易用的场景灯光:

照片
名称 介绍 适合场景
Mood Lighting 氛围灯。主要是通过在特定的环境中改变灯光的颜色和亮度等参数来创造一种特定的氛围,以营造舒适、浪漫、放松等感觉。从技术实现上看,Mood lighting则着重于灯光的颜色和亮度控制,注重创造强烈的视觉效果。 Mood lighting通常用于室内设计、酒店、餐厅及居家装饰等领域,旨在创造出一种特定的气氛和体验。

| | Moody Lighting | 情绪灯。它更强调在情感表达和为故事情节服务方面的应用,设计的目的是要把灯光与剧情完美结合起来,以展现角色的个性和情感世界。从技术实现上看,Moody lighting通常采用低亮度和大比例遮挡阴影,强调暗部的扫描,以增加画面的纹理和层次感。 | Moody lighting通常用于影视制作、游戏界面、舞台表演等领域,设计的目的是为了增加故事情节的戏剧效果。 |

| | Studio Lighting | 工作室灯光。是一种专门用于摄影工作室、电视和电影等领域的照明设计。它将光源和灯具放置在一个专用的摄影工作室中,通过精细的照明来创造出各种不同的氛围和场景效果,以满足各种不同的拍摄需求。 | Studio lighting 主要应用于商业摄影、时装摄影、艺术摄影、人像摄影、广告拍摄、电影和电视制作等领域,目的是通过精细的照明设计来突出主体的特点,达到最佳的拍摄效果。 |

| | Cove Lighting | 壁角灯。是一种常用的室内照明设计,其灯具通常安装在墙壁或吊顶壁橱之间的壁角(即“壁橱”)中,从而营造出舒适、柔和、光滑的环境照明效果。 | 这种照明技术可以为房间提供均匀的光线,同时提高房间的美感和时尚度。 |

| | Soft Lighting | 柔和照明。是指通过使用柔和、漫射的光线来创造出柔和、温暖的氛围效果。柔和的光线通常是通过使用的漫射灯具来实现的,较为常见的是壁灯、台灯、阅读灯等。 | 柔和照明效果可以降低照度,减轻视觉疲劳,创造出舒适的氛围和感觉。 |

| | Hard Lighting | 硬朗照明。是指通过使用聚光灯、筒灯等灯具来聚焦到一个特定的区域中,其光线是相对集中而直接的。 | 创造出刚硬、明亮的照明效果。硬朗照明常常用于展示场合,如美术馆、商场等环境,以突出展品或商品的特点和质感。 |

| | Volumetric Lighting | 体积光。是一种创造逼真渲染效果的照明效果技术。它通过在某些场景中添加灯光和各种视觉效果,如扩散、雾、粒子、阴影等,在照明场景中模拟空气中的粒子和尘埃微粒的现象,从而创造出动态、逼真、增强立体感和体积感的照明效果。 | 适用于多种场景设计中,如电影、电视、视频游戏、动画等领域。它可以让场景更加逼真、立体,增加场景的紧张度和视觉层次感,并带来更具有表现力的视觉效果。 |

| | Low-Key Lighting | 低键照明。指的是一种特殊的照明效果,该效果通常通过强烈的侧光或背光和阴影来创造高对比度的画面效果。低键照明的特点是明暗分明、阴影浓重、暗调占主导地位,常常构建一种紧张、神秘或黑暗的氛围。 | 低键照明广泛应用于电影、电视、摄影等领域中,常常用来表现悬疑、恐怖、犯罪等要素。 |

| | High-Key Lighting | 高键照明。这种照明效果通过使用明亮、均匀的光线来避免明暗对比并压低阴影的出现。这种照明效果特点是亮度高、细节丰富,适用于需要传递愉悦、轻松和开心氛围的场景和环境。 | 高键照明通常用于广告、情感电影、电视剧等中。 |

| | Epic Light | 史诗光线。是一种创建极富戏剧性、威严感和视觉效果的照明技术,它可以在场景中添加非常亮烈、盛大、壮观的光线,以吸引观众注意力并增加场景的震撼力。 | Epic Light通常用于影视制作、游戏开发、演出等领域中,以营造出一种崇高、壮丽、宏伟的氛围,可以使观众在看到这些效果时,感到非常震撼和难以忘怀。史诗光线的特点是亮度较高、颜色鲜艳,通常用于表现重要的剧情点,如武器的激光、宇宙战争中的太阳和星星、幻想电影和电子游戏中的神秘光芒等。 |

| | Rembrandt Lighting | 伦勃朗特效是一种起源于荷兰画家伦勃朗的照明效果,其主要特点是在人物脸部形成一个菱形的明暗分界线,嘴巴和下巴的一侧用阴影覆盖,人物的另一侧则被亮光照亮。 | 能营造出一种柔和而神秘的效果。 |

| | Contre-Jour | 逆光照明。指的是摄影师将光源放置在被摄物体的背后,令照射效果在镜头前面产生,形成被摄体轮廓明显的负片形态。 | 于光源位置造成的暗摄影整体的虚化,高对比度和鲜明的轮廓线可以带来文艺和抽象的氛围。 |

| | Veiling Flare | 透镜毛玻璃。指当光线从透镜或镜头穿过时,透过玻璃或镜头的反光或散射使得图像出现散射光线或最终成像看起来失真的现象。 | |

| | Crepuscular Rays | 黎明、黄昏光线。也称为太阳光柱,是由日光在云层或尘埃中被反射形成的光线束。因为只有在日出和日落时才有足够的光线穿过云层或照射到恰当的夹角,所以Crepuscular Rays通常只出现在日出和日落时刻。 | Crepuscular Rays通常会在云层上形成明显的束状光线,给人以美丽的感觉。 |

| | Rays of Shimmering Light | 闪烁光线。是指在光线散射和折射时出现的光线折射现象。在某些特定的环境下,光线经过不同密度和温度不同的气氛,会出现一种光线折射、散射的效果,从而形成闪烁光束效果。 | |

| | Godrays | 神光。是一种由光线穿过云朵、树枝或其他障碍物时,形成的亮光条纹效果。Godrays通常在光线较强的时分出现,将光线分割成条纹状,形成一种梦幻般的效果,也被称为 “crepuscular rays” 的一种。 | |

场景8:人物

名人照片

这算是 V5 的新特性,Midjourney 在 V5 版本认识很多名人,你可以在描述主体的时候,加上名人的名字,就可以生成该名人的照片,我们生成几个电影里的经典照片:

MJ063.png

第一个是 Keanu Reeves,第二个是 Vito Corleone(我并没有输入主演人 Marlon Brando),两组图的 prompt 都非常简单,你可以尝试自己写一下😁

本章最后有答案。

衣服模特

做衣服类电商的朋友可能会比较需要这个功能:

  1. 用 AI 生成一个虚拟人
  2. 然后将货物照片(比如某件衣服)传给 AI
  3. AI 将虚拟人和货物的照片融合在一起

坦率说来,我觉得 Midjourney 应该是可以的,但目前的效果还不太好,要想实现这个需求,只需要用到前面介绍的技巧九里提到的 blend 功能,详细方法就不在这赘述了,大致就是我将商品图和人物图用 blend 功能融合了下:

MJ062.png

为了验证一致性,我生成了几张 Reeves 的图分别尝试了下,最后输出的结果是这样的:

MJ064.png

整体来看,好像还行,但真的用在商品描述图里,我觉得还不太可能,因为里面的衣服跟原图差距还比较大(可以细看里面的纽扣)。

但我觉得未来 Midjourney 可能会优化好这个功能,并且我觉得如果可以自己训练模型,这个功能实现起来应该不难。

老照片

这个算是名人照片的分支玩法,最近大家应该看到过很多类似的照片,其实 prompt 很简单,主体和背景大家用翻译软件搞搞就行:

Prompt 解释
类型是什么? photography 照片
主体是什么? a group of Chinese people gathered around Darth Vader 一群中国人在围观达斯维达
环境是怎样的? on the street 大街上
构图是怎样的? null 不太重要,就让 AI 自由发挥
用什么镜头? fuji film 为了使得照片更有那味,增加了一个富士电影镜头
是什么风格? style of 1990s 增加了一个 90s风格

用类似的 prompt 生成了两组图片:

MJ095.png

技巧十四:增加风格——年份

上面的老照片场景,我们用了 1990s 风格,严格地说,这个 1990s 更适合放在主体,或者环境里,放在风格里也不是不行,因为不仅仅希望主体是 1990s 还希望图片生成的风格也是 1990s。

这就是最后一种风格词用法:年代。

拿插画那一章的两个 prompt 修改一下,我都没在 prompt 里加艺术家的名字,而是改为 style of 1920s,玫瑰的图有点那味,猫的图右上角那张太逗了。

MJ096.png

名人照片答案

Reeves 很简单,就是说明主体,然后注明穿着标志性的衣服,走在大雨里:

Keanu Reeves, wearing a black long leather coat, walking down the street in the rain

然后教父的那张就更简单了:

Vito Corleone sitting on a chair

技巧十五:如何让 Midjourney 生成的人更具有多样性?

这里的多样性其实是指人的高矮胖瘦,甚至身体的一些特殊性等。

不知道各位有没有发现,大多数用 AI 生成的图片,人物都非常漂亮和英俊,但这并不好,这其实某种程度上代表了社会的偏见。

所以我想在本章重点介绍下,如何让 Midjourney 生成更多样的人体。

方法一:Slider 方法

在上一章,我介绍了增加权重的方法,这个方法还可以帮助你生成不同体型的人物,以下是 Midjourney 官方社区的案例:

Plus-sized ginger female dressed in bohemian vest, maxi skirt, espadrilles, walking across autumn campus courtyard, morning atmosphere:: plus-sized::-0.3 --ar 2:3

你可以控制 plus-sized 后面的参数,从而使画面中的人物变胖或者变瘦。这里需要注意,并不是负数就是越瘦的意思,而是削弱了 plus-sized 权重,如果你的 prompt 词是 thin 你加个负数 slider 参数那就是变胖了:

MJ119.png

方法二:直接描述

Midjourney 是知道一些多样性的词语的,比如:

  • blind:失明
  • deaf:聋
  • cerebral palsy:小儿麻痹
  • accessibility:行动不便

MJ120.png

场景9:风景

实物和人物介绍完,介绍一下风景。坦率说来,我并不擅长摄影,所以这三章写得可能会不太专业。我更多地是介绍方法,以及告知大家可能性。

如果有不对的地方,请见谅。

微缩景观

风景大片,我觉得大家应该都在各大平台看过了,所以本章不会介绍太多常见的风景制作方法。而是介绍一些少见的,我这里介绍一个比较有趣的类型:

Prompt 解释
类型是什么? Miniature faking 迷你化仿效果(Miniature faking),也称为玩具世界效果,是一种通过特定的拍摄和处理技术来创造出一种缩小的场景感觉的方法。这种技术可以让实际大小的对象看起来像是一些小的塑料或金属模型。
主体是什么? Train Lines 火车线路
环境是怎样的? null 不太重要,就让 AI 自由发挥
构图是怎样的? null 不太重要,就让 AI 自由发挥
用什么镜头? null 不太重要,就让 AI 自由发挥
是什么风格? style of Japanese 我想要那种日本火车style,所以加了这个参数

另外还制作了一个火星工厂:

Prompt 解释
主体是什么? Mars Factory 火星工厂

MJ121.png

另外,我还很喜欢用这个效果制作一些多肉植物的照片,主体只要填写:cute mini Haworthia cymbiformis plant in a pot,或者 cute mini Aloe plant in a pot :

MJ125.png

参考链接:

https://github.com/thinkingjimmy/Learning-Prompt

https://github.com/wangxuqi/Prompt-Engineering-Guide-Chinese

https://github.com/tonyyuhang/ChatGPT/tree/main

https://github.com/f/awesome-chatgpt-prompts

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。