stable diffusion 小白入门教程 | 提示词教程 |

举报
赵KK日常技术记录 发表于 2023/07/09 12:11:40 2023/07/09
【摘要】 常见问题排查- CUDA out of memory: 炸显存 换启动参数 换显卡- DefaultCPUAllocator: 炸内存 加虚拟内存 加内存条- CUDA driver initialization failed: 装CUDA驱动- Training models with lowvram not possible: 这点显存还想炼丹?部署流程基础部署流程同云服务器部署步骤一样...
  1. 常见问题排查

- CUDA out of memory: 炸显存 换启动参数 换显卡
- DefaultCPUAllocator: 炸内存 加虚拟内存 加内存条
- CUDA driver initialization failed: 装CUDA驱动
- Training models with lowvram not possible: 这点显存还想炼丹?
  1. 部署流程
  1. 基础部署流程同云服务器部署步骤一样

  1. 注意:显卡配置要求为N卡优先,适配程度高,CPU与主板要求不高,但需要跟显卡适配,运行过程温度较高,所以散热需要跟上,需要ATX3.0电源或者850W以上,可以物理降温,空调拉倒最低
  1. 本地部署步骤,下面有一键安装包无需任何操作,不需要准备任何环境,但基础环境需要自己准备,方便后续使用

  1. 1.优先有N卡的来,1060ti也能玩,A卡能玩吗?也能玩,但是A卡的教程少,内存不够的也劝退,总之AI有风险,N卡在咆哮。
  2. 2.论文和资料极其多,丧心病狂的多
  3. 3.苹果电脑需要系统在12.1+但是建议大家N卡
  4. 4.笔记本也可以,所有的N卡在低配环境下可以使用CPU跑图,,但是建议大家N卡(算了手动滑稽)
  5. 5.以上条件都不满足,online,在线社区邀请码官方更新中,邀请码每次更新就被抢光了,大家第一时间关注动态,交流群第一时间发送,内测链接,社区,邀请码实时更新
  6. 相关论文:
  7. Stable Diffusion官网:https://beta.dreamstudio.ai/generate?from=%2Fdream controlnet 论文地址:https://arxiv.org/pdf/2302.05543.pdf 项目地址:https://github.com/lllyasviel/ControlNet Lora论文:https://arxiv.org/abs/2106.09685
  1. 1.1优化启动/运行速度

  1. 1.配置优先
  2. 2.xfomers
  3. 3.显卡驱动更新,对应显卡型号
  4. 4.显卡优化至8G以下,8G以上不需要
  5. 5.webui设置参数:
  1. 1.基础环境准备(启动器无需安装,但建议安装git)

  1. git加速器:gitee/github边车devsidercar
  2. https://gitee.com/docmirror/dev-sidecar/releases
  3. 注:会更改本地代理服务器,第二次上网需要关闭,或者长期开启,关闭在控制台设置:搜索代理,关闭代理,拉取ncpm/git远程仓库开启加速,
  4. 物理加速:凌晨下载模型,仓库,拉取镜像等等
  1. Python:版本3.10或者3.9+
  1. Git:官网下载地址:
  2. Pytorch/CUDA:官网拉取GPU对应的pytorch https://pytorch.org/get-started/locally/
  1. 2.配置要求N卡 参考主页AI算力跑图性能
  2. 个人配置跟不上的推荐online
  1. 3.模型拉取/模型之间的搭配,存放路径

  1. 大模型存放路径:根路径\sd-webui-aki-v4\models\stable diffution
  2. Lora模型存放:根路径\sd-webui-aki-v4\models\Lora
  3. Lora如何展示预览图:在lora根目录下存放与Lora模型同名.png图片
  4. 示例:
  5. [LoHa] Oboro_朧 Concept (With multires noise version)_LoHa v1.0.png
  6. [LoHa] Oboro_朧 Concept (With multires noise version)_LoHa v1.0.safetensors
模型一般都是直接下载,插件支持扩展从网址安装/git clone 也支持
  1. Lora分门别类:
  1. 1.1 WD tagger【线稿提示词提取】

  1. 1.2插件下载

  1. 1.3下载完插件记得重启UI

  1. 1.4菜单功能解释

  1. 2.爆显存参数设置:

第一步: 点击键盘 Win + R 然后输入%temp% 回车进入文件夹后删除所有缓存文件 第二步: 开始 - 设置 - 系统 - 存储 - 其他 - 删除文件夹里面的所有内容 开始 - 设置 - 系统 - 存储 - 临时文件 - 选择性删除 第三步: 我的电脑 - 上方路径处输入:%LocalAppData%\pip - 点击回车 - 把cache里的所有文件夹删掉 最后: 清空回收站
  1. Tile VAE 防爆内存

  1. 4.1.先检查启动器参数:
  1. 4.2.外挂VAE选择自定义,不指定为autoencoder(自动解码)
  2. 4.3.文件位置:根目录/与exe同级别目录/webui-user.bat,使用文本编辑器打开/或者管理员打开
  3. 设置参数
webui-user.bat @echo off #此处为新加配置,改动任何配置文件需要备份,一次性不要改动多处!!! set PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:32 set PYTHON= set GIT= set VENV_DIR= set COMMANDLINE_ARGS= call webui.bat
  1. 4.4借助优化工具优化显存
推荐process lasso
删除缓存文件
  1. 1.把视频转为帧:一键切帧
  2. 切帧工具我发给你
  3. 2.图生图选择合适的seed
  1. 3.转到mov2mov,调整参数,controlnet,步数,重绘幅度
  1. 3.解决手部重绘问题

提示词:hand out of frame
反向:bad hands
  1. https://github.com/jexom/sd-webui-depth-lib https://upscale.wiki/wiki/Model_Database 链接:https://pan.baidu.com/s/1jo8SraCqHA0shizeGA-eXQ?pwd=o6sl 提取码:o6sl
  1. 4.二次元画风参数

  1. ((8k, best quality)),((Exquisite facial features)),((Anime style:1.2)),(1girl, full body),((Standing posture ,looking at viewer )),((JK Style,JK short skirt, Football Baby Knee Socks,flashlight)),Cyberpunk, holographic aura, surreal science fiction art, future science fiction aesthetics, Han style clothing, clothing influenced by ancient Chinese operas,masterpiece, best quality,, masterpiece,best quality,ultra-detailed,very detailed illustrations,extremely detailed,intricate details,highres,super complex details,extremely detailed 8k cg wallpaper, blue eyes,white hair, cyberpunk, sense of technology.
  2. 反向提示词:
  3. nsfw,(low quality,normal quality,worst quality,jpeg artifacts),cropped,monochrome,lowres,low saturation,mutated hands,mutated fingers,deformed,bad anatomy,disfigured,poorly drawn face,extra limb,ugly,poorly drawn hands,missing limb,floating limbs,disconnected limbs,out of focus,long neck,long body,extra fingers,fewer fingers,,(multi nipples),bad hands,signature,username,bad feet,blurry,bad body
  4. 参考图:



  1. 5.个人常用大模型总结

  1. 个人常用Lora模型:

  1. 自动生成提示词话术:
  2. 秋叶频道目标提供: Stable Diffusion prompt 助理 你来充当一位有艺术气息的Stable Diffusion prompt 助理。 ## 任务 我用自然语言告诉你要生成的prompt的主题,你的任务是根据这个主题想象一幅完整的画面,然后转化成一份详细的、高质量的prompt,让Stable Diffusion可以生成高质量的图像。 ## 背景介绍 Stable Diffusion是一款利用深度学习的文生图模型,支持通过使用 prompt 来产生新的图像,描述要包含或省略的元素。 ## prompt 概念 - 完整的prompt包含“Prompt:”和"Negative Prompt:"两部分。 - prompt 用来描述图像,由普通常见的单词构成,使用英文半角","做为分隔符。 - negative prompt用来描述你不想在生成的图像中出现的内容。 - 以","分隔的每个单词或词组称为 tag。所以prompt和negative prompt是由系列由","分隔的tag组成的。 ## () 和 [] 语法 调整关键字强度的等效方法是使用 () 和 []。 (keyword) 将tag的强度增加 1.1 倍,与 (keyword:1.1) 相同,最多可加三层。 [keyword] 将强度降低 0.9 倍,与 (keyword:0.9) 相同。 ## Prompt 格式要求 下面我将说明 prompt 的生成步骤,这里的 prompt 可用于描述人物、风景、物体或抽象数字艺术图画。你可以根据需要添加合理的、但不少于5处的画面细节。 ### 1. prompt 要求 - 你输出的 Stable Diffusion prompt 以“Prompt:”开头。 - prompt 内容包含画面主体、材质、附加细节、图像质量、艺术风格、色彩色调、灯光等部分,但你输出的 prompt 不能分段,例如类似"medium:"这样的分段描述是不需要的,也不能包含":"和"."。 - 画面主体:不简短的英文描述画面主体, 如 A girl in a garden,主体细节概括(主体可以是人、事、物、景)画面核心内容。这部分根据我每次给你的主题来生成。你可以添加更多主题相关的合理的细节。 - 对于人物主题,你必须描述人物的眼睛、鼻子、嘴唇,例如'beautiful detailed eyes,beautiful detailed lips,extremely detailed eyes and face,longeyelashes',以免Stable Diffusion随机生成变形的面部五官,这点非常重要。你还可以描述人物的外表、情绪、衣服、姿势、视角、动作、背景等。人物属性中,1girl表示一个女孩,2girls表示两个女孩。 - 材质:用来制作艺术品的材料。 例如:插图、油画、3D 渲染和摄影。 Medium 有很强的效果,因为一个关键字就可以极大地改变风格。 - 附加细节:画面场景细节,或人物细节,描述画面细节内容,让图像看起来更充实和合理。这部分是可选的,要注意画面的整体和谐,不能与主题冲突。 - 图像质量:这部分内容开头永远要加上“(best quality,4k,8k,highres,masterpiece:1.2),ultra-detailed,(realistic,photorealistic,photo-realistic:1.37)”, 这是高质量的标志。其它常用的提高质量的tag还有,你可以根据主题的需求添加:HDR,UHD,studio lighting,ultra-fine painting,sharp focus,physically-based rendering,extreme detail description,professional,vivid colors,bokeh。 - 艺术风格:这部分描述图像的风格。加入恰当的艺术风格,能提升生成的图像效果。常用的艺术风格例如:portraits,landscape,horror,anime,sci-fi,photography,concept artists等。 - 色彩色调:颜色,通过添加颜色来控制画面的整体颜色。 - 灯光:整体画面的光线效果。 ### 2. negative prompt 要求 - negative prompt部分以"Negative Prompt:"开头,你想要避免出现在图像中的内容都可以添加到"Negative Prompt:"后面。 - 任何情况下,negative prompt都要包含这段内容:"nsfw,(low quality,normal quality,worst quality,jpeg artifacts),cropped,monochrome,lowres,low saturation,((watermark)),(white letters)" - 如果是人物相关的主题,你的输出需要另加一段人物相关的 negative prompt,内容为:“skin spots,acnes,skin blemishes,age spot,mutated hands,mutated fingers,deformed,bad anatomy,disfigured,poorly drawn face,extra limb,ugly,poorly drawn hands,missing limb,floating limbs,disconnected limbs,out of focus,long neck,long body,extra fingers,fewer fingers,,(multi nipples),bad hands,signature,username,bad feet,blurry,bad body”。 ### 3. 限制: - tag 内容用英语单词或短语来描述,并不局限于我给你的单词。注意只能包含关键词或词组。 - 注意不要输出句子,不要有任何解释。 - tag数量限制40个以内,单词数量限制在60个以内。 - tag不要带引号("")。 - 使用英文半角","做分隔符。 - tag 按重要性从高到低的顺序排列。 - 我给你的主题可能是用中文描述,你给出的prompt和negative prompt只用英文。 主题是: 我:接下来我会发一个Midjourney的万能公式给你,请你学习一下,如果你理解了,请输出【明白了】,公式是:主体描绘 + 核心主体 + 主体动作 + 风格 + 光效 + 色彩 + 视角 + 质量 + 命令,下面是对公式中各个属性的讲解: 核心主体:人,如Young woman,Old male;动物,如Tiger老虎,Fox狐狸,Rooster公鸡;地方,如New York纽约市 ,Roman Colosseum罗马斗兽场,Stadium体育馆 主体描绘:Cute可爱,Gorgeous华丽,Mysterious神秘的,Full body全身 主体动作:“be doing”或“逗号+doing”,如 “Peppa is reading the newspaper” 佩奇在读报纸,“A girl, laughing, holding microphone”小女孩拿着麦克风大笑 风格:艺术风格,如Pixel art像素画风,minimalist极简主义;艺术家,如Pixar皮克斯工作室,Ghibli宫崎骏/吉卜力工作室;材质,如Frosted glass毛玻璃,Chrome metal铬金属 光效:Spotlight 聚光,Backlight逆光,Glowing neon霓虹灯 色彩:Warm color暖色调,Pastel color粉彩色,Dark Cyan深青色 视角:Closeup近景特写,Epic wide shot史诗广角,Low angle低角度仰拍 质量:Extremely detailed极为细致,UHD超高清,Realistic逼真 命令:图片尺寸“–ar [x]:[y]”,[x]为宽、[y]为高,如“–ar 16:9”、“–ar 3:4”;模型版本“–v [n]” ,[n]为数字,目前版本有1~5,以及Niji ChatGPT:明白了 我:我希望你直接按照这个顺序【主体描绘 + 核心主体 + 主体动作 + 风格 + 光效 + 色彩 + 视角 + 质量 + 命令】,把Midjourney的关键词写出来,注意不要添加解释性的语言,公式中的每个属性直接用逗号隔开,例如Young woman,Cute,reading the newspaper,Pixel art,Spotlight ,Warm color,Closeup,Extremely detailed,–ar 2:3,请认真思考一下!如果你理解了,请输出【明白了】 ChatGPT:明白了 我:接下来的对话中,我会用【下一个提示词:内容】这个格式提问,请帮我把【内容】按照上面的格式要求输出,注意不要添加解释性的语言,如果你明白了,请输出【明白了】 ChatGPT:明白了 我:下一个提示词:金黄色的天空下,落日的余晖洒在了远方的大海上。站在海边的围栏边,一位穿着白色运动背心的中国模特正在享受这美妙的时刻。她的长发微微飘动,双手拿着手机,似乎在记录什么特殊的瞬间。她的美丽令人心醉神迷,仿佛阻挡不了这美好时刻流逝的速度。在这美丽的背景中,手机变得显得多余了,但同时又成为了记录这美好时刻的必要工具。这真是一个令人心驰神往的画面。(这段话我也是用ChatGPT生成的,实际上可以简化成:中国模特,夕阳,大海,栏杆) ChatGPT:Gorgeous, Chinese model, wearing a white sporty tank top and standing by the seaside railing, holding a smartphone and capturing the moment, Realistic painting, Warm sunset light, Golden sky and ocean, Wide-angle, UHD, --ar 16:9 最后把这段咒语放到mj上生成即可。 ———————————————— 版权声明:本文为CSDN博主「柚米汇」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/weixin_38428126/article/details/130308638 You can write prompts with variables, like {{variable_1}}, or {{variable_2}}. You don’t have to use “variable”, though.You can write anything, for example:An image of 2 objects, {{object_1}}, and {{object_2}}. or staring up into the infinite celestial library, endless {{item_2}}, flying {{item_1}}, {{adjective_1}}, sublime, cinematic lighting, watercolor, mc escher, dark souls, bloodborne, matte painting This is only an example, come up with new ideas, art styles, etc. So this is the Dynamic Prompt Format. I want you to write the perfect dynamic prompt for me to query Midjourney with one message, and include some dynamic variables where you see fit.You may use the following guide to help you: Midjourney Rules (this was too long to add to the post) Write a detailed dynamic prompt for “IMAGE_IDEA”
  1. 重绘/inpainting/蒙版重绘/后期处理

  1. 1.放大系数选择:默认为regional时,根据画面大小,选择32/64,以重绘中心扩散半径计算,但系数越大,与周边融合越没有违和感
  2. 2.inpainting vs 蒙版重绘 vs regional
  3. 3.后期处理:upscale系数算法选择一致,scale在0时影响介入,1时效果最小
  4. 选择original 再搭配Adetailer 效果不明显,需要选择fill,单元格选择face_mesh ,重绘填充半径32-64效果搭配脸部手部,提示词系数目前推荐0.5以上
  5. cn重绘 inpainting
  1. 视频教程



  1. mov2mov vs Temporal

  1. 扩展加载自:https://github.com/Scholar01/sd-webui-mov2mov
  2. 1 是否闪动
  3. mov2mov在tile模式下如果本身视频动作幅度较大,人不统一,会出现缺帧,少帧,甚至跳帧情况,除了一键合成工具,AR支持视频帧转入然后合成视频,不过AR本身操作的视频合成效果对帧数要求较高,最低30帧,如果需要一键切帧后再转视频有很多在线网站,但是推荐mov2mov形式合成
  4. Temporal(Temporalkit)更轻量化,防呆一键操作
  5. - 支持多个 ebsynth 项目(以避免 20 个关键帧限制)。 - 自动场景检测,剪切和重组。 - 显著的性能提升。
  6. Temporal-Kit+EbSynth效果丝滑
  7. git地址:https://github.com/CiaraStrawberry/TemporalKit
  8. 2.是否缺帧
  9. mov2mov会在1的场景下缺帧
  10. Temporal-Kit+EbSynth效果丝滑
  11. 3.硬件要求
  12. 都需要搭配stable diffusion,如果想要高质量视频可以后期对问题帧进行PS,转入inpainting再次绘制
  13. 4.速率
  14. 依赖硬件
  1. 8.Controlnet预处理器作用

  1. 8.1.controlnet开多个tab窗口unit
  2. 1.打开设置
  1. 2.搜索或者下拉至controlnet,改变最大单元格,重启UI。
  1. 3.记得勾选启用才能使用,当启用后最新版会变成绿色
  1. 4.预处理器作用
renference_only(仅参考输入图)
保留原图人物细节,画风迁移
invert
简单上色
openpose(姿态提示)
姿态参考(人物)
seg
色块提示(场景)
shuffle
重新分布图片色彩(色彩) 使用色彩图素材
tile
增加细节 配合去除景深,使用精确背景去除工具得到人物蒙版,回送脚本
media_pipe face(脸部边缘检测)
用于生成表情
hed(边缘检测)
用于ai动画生成
canny(边缘检测)
轮廓提示
lineart(线稿提取)
轮廓提示
softedge(软边缘检测)
轮廓提示
depth
场景远近提示
  1. 9.SD插件目录推荐

  1. 根据个人喜好推荐大家安装插件,首先阅读前文,确定插件和模型的区别,以及插件的安装目录,下面是插件名称以及作用目录安装目录/extentions
  1. 1.2.1常用插件3D openpose

  1. 1.基础菜单:
  2. 文件:可根据文件生成[人物骨骼3D图],或者上传蒙版图片定位骨骼位置
  3. 编辑:撤销/重做
  4. 视图:锁定/释放
  5. 设置:移动模式控制驱赶姿态移动,非移动控制角度
  6. 反馈:忽略
  7. 语言:设置为中文


composable-lora
LoRA修饰限制
https://github.com/opparco/stable-diffusion-webui-composable-lora

controlnet
扩散控制网络
https://github.com/Mikubill/sd-webui-controlnet

cutoff
色彩分离
https://github.com/hnmr293/sd-webui-cutoff

images-browser
图库浏览器
https://github.com/AlUlkesh/stable-diffusion-webui-images-browser

locon
LyCORIS 兼容插件(LoCon/LoHa)
https://github.com/KohakuBlueleaf/a1111-sd-webui-locon

Multidiffusion
分块多重扩散
https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111

tagcomplete
tag自动补全
https://github.com/DominikDoom/a1111-sd-webui-tagcomplete

two-shot/latent couple
画面分区(分支)
https://github.com/ashen-sensored/stable-diffusion-webui-two-shot

Civitai-Helper
C站助手
https://github.com/butaixianran/Stable-Diffusion-Webui-Civitai-Helper

kitchen-theme
Kitchen 主题
https://github.com/canisminor1990/sd-web-ui-kitchen-theme

two-shot/latent couple
画面分区
https://github.com/opparco/stable-diffusion-webui-two-shot

3d-open-pose-editor
3D OpenPose 编辑器
https://github.com/nonnonstop/sd-webui-3d-open-pose-editor

Config-Presets
预设配置
https://github.com/Zyin055/Config-Presets

depth-lib
深度图编辑插件
https://github.com/jexom/sd-webui-depth-lib

grid_add_image_number
图片序号标注插件
https://github.com/AlUlkesh/sd_grid_add_image_number.git

openpose-editor
OpenPose 编辑器
https://github.com/fkunn1326/openpose-editor

system-info
系统信息
https://github.com/vladmandic/sd-extension-system-info

additional-networks
可选附加网络(LoRA插件)
https://github.com/kohya-ss/sd-webui-additional-networks

aesthetic-scorer
美学评分插件
https://github.com/vladmandic/sd-extension-aesthetic-scorer

Local Latent upscaLer
局部细化
https://github.com/hnmr293/sd-webui-llul

merge-block-weighted
分块加权模型合并插件(MBW)
https://github.com/bbc-mc/sdweb-merge-block-weighted-gui.git

novelai-2-local-prompt
novelai 转 webui 括号
https://github.com/animerl/novelai-2-local-prompt

pixelization
像素化插件
https://github.com/AUTOMATIC1111/stable-diffusion-webui-pixelization

rembg
背景去除插件
https://github.com/AUTOMATIC1111/stable-diffusion-webui-rembg.git

tokenizer
词元分析器
https://github.com/AUTOMATIC1111/stable-diffusion-webui-tokenizer

vram-estimator
显存评估
https://github.com/space-nuko/a1111-stable-diffusion-webui-vram-estimator

wd14-tagger
Tag反推(Tagger)
https://github.com/toriato/stable-diffusion-webui-wd14-tagger

bilingual-localization
双语本地化插件
https://github.com/journey-ad/sd-webui-bilingual-localization

catppuccin
界面个性化设置
https://github.com/catppuccin/stable-diffusion-webui

gelbooru-prompt
Gelbooru标签自动摘录
https://github.com/antis0007/sd-webui-gelbooru-prompt

model-converter
模型格式转换
https://github.com/Akegarasu/sd-webui-model-converter

multiple-hypernetworks
多超网络加载
https://github.com/antis0007/sd-webui-multiple-hypernetworks

posex
3D OpenPose 编辑器(Posex)
https://github.com/hnmr293/posex

xyplus
X/Y图表 Plus 插件
https://github.com/bbc-mc/sdweb-xyplus

  1. 采样方法区别

  1. 10.0提示词教程

  1. 官网地址:https://github.com/PlexPt/awesome-chatgpt-prompts-zh
  2. 10.1.基础概念
  3. 如图所示,
  1. 绿色文字框为正向提示词,即文本需要出现的风格,人物,景观,主要元素
  2. 红色输入框为反向提示词,即文本中不需要出现的元素,即多手,多脚,劣质画质等等
  3. 2.提示词由主题人物,元素,背景,灯光,等多个维度构成,提示词对于prompt属于小维度,在prompt维度包含文本对话提示词,AI绘画提示词等等,但遵循原则是统一标准,大部分的规则是可以通过提示词实现的
  4. 例如:简单背景,纯人物,多人,单人,表情,pose等等,这些在语义对照表中均提到
  5. 3.遵循规则:
  1. 4.提示词权重
  2. 语法格式:单词:1.1倍,在提示词中不存在前面书写的单词比后面出现的单词权重高(前提是同权重)
  3. 第一:相同含义的提示词不会(不该)出现多次,当出现多次例如,1 girl 1 boy ,那么算法认为你需要1 girl or 1 boy or 1 girl and 1 boy,此时语义重复,对画面生成偶发性较高
  4. 第二:当相同含义的提示词出现在一前一后的时候,例如 blue hair 、white hair 算法认为那么对同一部分的描述即为:都需要,会出现又蓝又白的头发
  1. 5.提示词通用咒语

  1. Stable Diffusion prompt 助理 你来充当一位有艺术气息的Stable Diffusion prompt 助理。 ## 任务 我用自然语言告诉你要生成的prompt的主题,你的任务是根据这个主题想象一幅完整的画面,然后转化成一份详细的、高质量的prompt,让Stable Diffusion可以生成高质量的图像。 ## 背景介绍 Stable Diffusion是一款利用深度学习的文生图模型,支持通过使用 prompt 来产生新的图像,描述要包含或省略的元素。 ## prompt 概念 - 完整的prompt包含“**Prompt:**”和"**Negative Prompt:**"两部分。 - prompt 用来描述图像,由普通常见的单词构成,使用英文半角","做为分隔符。 - negative prompt用来描述你不想在生成的图像中出现的内容。 - 以","分隔的每个单词或词组称为 tag。所以prompt和negative prompt是由系列由","分隔的tag组成的。 ## () 和 [] 语法 调整关键字强度的等效方法是使用 () 和 []。 (keyword) 将tag的强度增加 1.1 倍,与 (keyword:1.1) 相同,最多可加三层。 [keyword] 将强度降低 0.9 倍,与 (keyword:0.9) 相同。 ## Prompt 格式要求 下面我将说明 prompt 的生成步骤,这里的 prompt 可用于描述人物、风景、物体或抽象数字艺术图画。你可以根据需要添加合理的、但不少于5处的画面细节。 ### 1. prompt 要求 - 你输出的 Stable Diffusion prompt 以“**Prompt:**”开头。 - prompt 内容包含画面主体、材质、附加细节、图像质量、艺术风格、色彩色调、灯光等部分,但你输出的 prompt 不能分段,例如类似"medium:"这样的分段描述是不需要的,也不能包含":"和"."。 - 画面主体:不简短的英文描述画面主体, 如 A girl in a garden,主体细节概括(主体可以是人、事、物、景)画面核心内容。这部分根据我每次给你的主题来生成。你可以添加更多主题相关的合理的细节。 - 对于人物主题,你必须描述人物的眼睛、鼻子、嘴唇,例如'beautiful detailed eyes,beautiful detailed lips,extremely detailed eyes and face,longeyelashes',以免Stable Diffusion随机生成变形的面部五官,这点非常重要。你还可以描述人物的外表、情绪、衣服、姿势、视角、动作、背景等。人物属性中,1girl表示一个女孩,2girls表示两个女孩。 - 材质:用来制作艺术品的材料。 例如:插图、油画、3D 渲染和摄影。 Medium 有很强的效果,因为一个关键字就可以极大地改变风格。 - 附加细节:画面场景细节,或人物细节,描述画面细节内容,让图像看起来更充实和合理。这部分是可选的,要注意画面的整体和谐,不能与主题冲突。 - 图像质量:这部分内容开头永远要加上“(best quality,4k,8k,highres,masterpiece:1.2),ultra-detailed,(realistic,photorealistic,photo-realistic:1.37)”, 这是高质量的标志。其它常用的提高质量的tag还有,你可以根据主题的需求添加:HDR,UHD,studio lighting,ultra-fine painting,sharp focus,physically-based rendering,extreme detail description,professional,vivid colors,bokeh。 - 艺术风格:这部分描述图像的风格。加入恰当的艺术风格,能提升生成的图像效果。常用的艺术风格例如:portraits,landscape,horror,anime,sci-fi,photography,concept artists等。 - 色彩色调:颜色,通过添加颜色来控制画面的整体颜色。 - 灯光:整体画面的光线效果。 ### 2. negative prompt 要求 - negative prompt部分以"**Negative Prompt:**"开头,你想要避免出现在图像中的内容都可以添加到"**Negative Prompt:**"后面。 - 任何情况下,negative prompt都要包含这段内容:"nsfw,(low quality,normal quality,worst quality,jpeg artifacts),cropped,monochrome,lowres,low saturation,((watermark)),(white letters)" - 如果是人物相关的主题,你的输出需要另加一段人物相关的 negative prompt,内容为:“skin spots,acnes,skin blemishes,age spot,mutated hands,mutated fingers,deformed,bad anatomy,disfigured,poorly drawn face,extra limb,ugly,poorly drawn hands,missing limb,floating limbs,disconnected limbs,out of focus,long neck,long body,extra fingers,fewer fingers,,(multi nipples),bad hands,signature,username,bad feet,blurry,bad body”。 ### 3. 限制: - tag 内容用英语单词或短语来描述,并不局限于我给你的单词。注意只能包含关键词或词组。 - 注意不要输出句子,不要有任何解释。 - tag数量限制40个以内,单词数量限制在60个以内。 - tag不要带引号("")。 - 使用英文半角","做分隔符。 - tag 按重要性从高到低的顺序排列。 - 我给你的主题可能是用中文描述,你给出的prompt和negative prompt只用英文。 主题:水精灵,人形态,仙子,

StableDiffusion是一款利用深度学习的文生图模型,支持通过使用提示词来产生新的图像,描述要包含或省略的元素。
我在这里引入StableDiffusion算法中的Prompt概念,又被称为提示符。
下面的prompt是用来指导AI绘画模型创作图像的。它们包含了图像的各种细节,如人物的外观、背景、颜色和光线效果,以及图像的主题和风格。这些prompt的格式经常包含括号内的加权数字,用于指定某些细节的重要性或强调。例如,"(masterpiece:1.5)"表示作品质量是非常重要的,多个括号也有类似作用。此外,如果使用中括号,如"{blue hair:white hair:0.3}",这代表将蓝发和白发加以融合,蓝发占比为0.3。
以下是用prompt帮助AI模型生成图像的例子:masterpiece,(bestquality),highlydetailed,ultra-detailed,cold,solo,(1girl),(detailedeyes),(shinegoldeneyes),(longliverhair),expressionless,(long sleeves),(puffy sleeves),(white wings),shinehalo,(heavymetal:1.2),(metaljewelry),cross-lacedfootwear (chain),(Whitedoves:1.2)

仿照例子,给出一套详细描述以下内容的prompt。直接开始给出prompt不需要用自然语言描述:
魔法小樱,权杖,光影,少女

One Button prompt 预设提示词,抽卡

下载插件:
插件--脚本--选择One Button
主题:
Art:
图像类型
预设前缀:
后缀:
NSFW:

  1. Gamma教程

  1. 完整版视频教学点这里

  1. 简单教程:
  2. 1.国内邮箱可进行注册
  1. 2.主页
  1. 3.
  1. 4.
  1. 5.输入主题
  1. 出现生成的主题,可自定义主题
  1. 等待生成可发送到邮箱,生成结果可编辑,导出的 PDF 可以用文章后面的转 PPT 工具


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。