- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Stable Diffusion基础教学详尽版

赵KK日常技术记录发表于 2023/06/24 13:07:50 2023/06/24

【摘要】部署流程基础部署流程同云服务器部署步骤一样注意：显卡配置要求为N卡优先，适配程度高，CPU与主板要求不高，但需要跟显卡适配，运行过程温度较高，所以散热需要跟上，需要ATX3.0电源或者850W以上，可以物理降温，空调拉到最低本地部署步骤，下面有一键安装包无需任何操作，不需要准备任何环境，但基础环境需要自己准备，方便后续使用1.优先有N卡的来，1060ti也能玩，A卡能玩吗？也能玩，但是A卡的...

部署流程

基础部署流程同云服务器部署步骤一样

注意：显卡配置要求为N卡优先，适配程度高，CPU与主板要求不高，但需要跟显卡适配，运行过程温度较高，所以散热需要跟上，需要ATX3.0电源或者850W以上，可以物理降温，空调拉到最低

本地部署步骤，下面有一键安装包无需任何操作，不需要准备任何环境，但基础环境需要自己准备，方便后续使用

1.优先有N卡的来，1060ti也能玩，A卡能玩吗？也能玩，但是A卡的教程少，内存不够的也劝退，总之AI有风险，N卡在咆哮。

2.论文和资料极其多，丧心病狂的多

3.苹果电脑需要系统在12.1+但是建议大家N卡

4.笔记本也可以，所有的N卡在低配环境下可以使用CPU跑图，，但是建议大家N卡(算了手动滑稽)

5.以上条件都不满足，online，在线社区邀请码官方更新中，邀请码每次更新就被抢光了，大家第一时间关注动态，交流群第一时间发送，内测链接，社区，邀请码实时更新

1.1 WD tagger【线稿提示词提取】

1.2插件下载

1.3下载完插件记得重启UI

1.4菜单功能解释

2.爆显存参数设置：

Tile VAE 防爆内存

4.1.先检查启动器参数：

4.2.外挂VAE选择自定义，不指定为autoencoder(自动解码)

4.3.文件位置：根目录/与exe同级别目录/webui-user.bat，使用文本编辑器打开/或者管理员打开

设置参数

@echo off# 此处为新加配置，改动任何配置文件需要备份，一次性不要改动多处！！！set PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:32set PYTHON=set GIT=set VENV_DIR=set COMMANDLINE_ARGS=
call webui.bat

4.4借助优化工具优化显存

推荐process lasso

1.把视频转为帧：一键切帧

切帧工具我发给你

2.图生图选择合适的seed

3.转到mov2mov,调整参数，controlnet，步数，重绘幅度

3.解决手部重绘问题

https://github.com/jexom/sd-webui-depth-libhttps://upscale.wiki/wiki/Model_Database链接：https://pan.baidu.com/s/1jo8SraCqHA0shizeGA-eXQ?pwd=o6sl 提取码：o6sl

4.二次元画风参数

((8k, best quality)),((Exquisite facial features)),((Anime style:1.2)),(1girl, full body),((Standing posture ,looking at viewer )),((JK Style,JK short skirt, Football Baby Knee Socks,flashlight)),Cyberpunk, holographic aura, surreal science fiction art, future science fiction aesthetics, Han style clothing, clothing influenced by ancient Chinese operas,masterpiece, best quality,, masterpiece,best quality,ultra-detailed,very detailed illustrations,extremely detailed,intricate details,highres,super complex details,extremely detailed 8k cg wallpaper, blue  eyes,white hair, cyberpunk, sense of technology.反向提示词：nsfw,(low quality,normal quality,worst quality,jpeg artifacts),cropped,monochrome,lowres,low saturation,mutated hands,mutated fingers,deformed,bad anatomy,disfigured,poorly drawn face,extra limb,ugly,poorly drawn hands,missing limb,floating limbs,disconnected limbs,out of focus,long neck,long body,extra fingers,fewer fingers,,(multi nipples),bad hands,signature,username,bad feet,blurry,bad body参考图：

5.个人常用大模型总结

个人常用Lora模型：

6.重绘/inpainting/蒙版重绘/后期处理

1.放大系数选择：默认为regional时，根据画面大小，选择32/64，以重绘中心扩散半径计算，但系数越大，与周边融合越没有违和感

2.inpainting vs 蒙版重绘 vs regional

3.后期处理：upscale系数算法选择一致，scale在0时影响介入，1时效果最小

7.mov2mov vs Temporal

1 是否闪动

mov2mov在tile模式下如果本身视频动作幅度较大，人不统一，会出现缺帧，少帧，甚至跳帧情况，除了一键合成工具，AR支持视频帧转入然后合成视频，不过AR本身操作的视频合成效果对帧数要求较高，最低30帧，如果需要一键切帧后再转视频有很多在线网站，但是推荐mov2mov形式合成

Temporal(Temporalkit)更轻量化，防呆一键操作

- 支持多个 ebsynth 项目（以避免 20 个关键帧限制）。- 自动场景检测，剪切和重组。- 显著的性能提升。

Temporal-Kit+EbSynth效果丝滑git地址：https://github.com/CiaraStrawberry/TemporalKit

2.是否缺帧

mov2mov会在1的场景下缺帧

Temporal-Kit+EbSynth效果丝滑

3.硬件要求

都需要搭配stable diffusion，如果想要高质量视频可以后期对问题帧进行PS，转入inpainting再次绘制

4.速率

依赖硬件

8.Controlnet预处理器作用

8.1.controlnet开多个tab窗口unit

1.打开设置

2.搜索或者下拉至controlnet,改变最大单元格，重启UI。

3.记得勾选启用才能使用，当启用后最新版会变成绿色

4.预处理器作用

renference_only(仅参考输入图)	保留原图人物细节，画风迁移
invert	简单上色
openpose（姿态提示）	姿态参考（人物）
seg	色块提示（场景）
shuffle	重新分布图片色彩（色彩）使用色彩图素材
tile	增加细节配合去除景深，使用精确背景去除工具得到人物蒙版，回送脚本
media_pipe face（脸部边缘检测）	用于生成表情
hed（边缘检测）	用于ai动画生成
canny（边缘检测）	轮廓提示
lineart（线稿提取）	轮廓提示
softedge（软边缘检测）	轮廓提示
depth	场景远近提示

9.SD插件目录推荐

根据个人喜好推荐大家安装插件，首先阅读前文，确定插件和模型的区别，以及插件的安装目录，下面是插件名称以及作用目录安装目录/extentions

1.2.1常用插件3D openpose

composable-lora	LoRA修饰限制	https://github.com/opparco/stable-diffusion-webui-composable-lora
controlnet	扩散控制网络	https://github.com/Mikubill/sd-webui-controlnet
cutoff	色彩分离	https://github.com/hnmr293/sd-webui-cutoff
images-browser	图库浏览器	https://github.com/AlUlkesh/stable-diffusion-webui-images-browser
locon	LyCORIS 兼容插件(LoCon/LoHa)	https://github.com/KohakuBlueleaf/a1111-sd-webui-locon
Multidiffusion	分块多重扩散	https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111
tagcomplete	tag自动补全	https://github.com/DominikDoom/a1111-sd-webui-tagcomplete
two-shot/latent couple	画面分区(分支)	https://github.com/ashen-sensored/stable-diffusion-webui-two-shot
Civitai-Helper	C站助手	https://github.com/butaixianran/Stable-Diffusion-Webui-Civitai-Helper
kitchen-theme	Kitchen 主题	https://github.com/canisminor1990/sd-web-ui-kitchen-theme
two-shot/latent couple	画面分区	https://github.com/opparco/stable-diffusion-webui-two-shot
3d-open-pose-editor	3D OpenPose 编辑器	https://github.com/nonnonstop/sd-webui-3d-open-pose-editor
Config-Presets	预设配置	https://github.com/Zyin055/Config-Presets
depth-lib	深度图编辑插件	https://github.com/jexom/sd-webui-depth-lib
grid_add_image_number	图片序号标注插件	https://github.com/AlUlkesh/sd_grid_add_image_number.git
openpose-editor	OpenPose 编辑器	https://github.com/fkunn1326/openpose-editor
system-info	系统信息	https://github.com/vladmandic/sd-extension-system-info
additional-networks	可选附加网络(LoRA插件)	https://github.com/kohya-ss/sd-webui-additional-networks
aesthetic-scorer	美学评分插件	https://github.com/vladmandic/sd-extension-aesthetic-scorer
Local Latent upscaLer	局部细化	https://github.com/hnmr293/sd-webui-llul
merge-block-weighted	分块加权模型合并插件(MBW)	https://github.com/bbc-mc/sdweb-merge-block-weighted-gui.git
novelai-2-local-prompt	novelai 转 webui 括号	https://github.com/animerl/novelai-2-local-prompt
pixelization	像素化插件	https://github.com/AUTOMATIC1111/stable-diffusion-webui-pixelization
rembg	背景去除插件	https://github.com/AUTOMATIC1111/stable-diffusion-webui-rembg.git
tokenizer	词元分析器	https://github.com/AUTOMATIC1111/stable-diffusion-webui-tokenizer
vram-estimator	显存评估	https://github.com/space-nuko/a1111-stable-diffusion-webui-vram-estimator
wd14-tagger	Tag反推(Tagger)	https://github.com/toriato/stable-diffusion-webui-wd14-tagger
bilingual-localization	双语本地化插件	https://github.com/journey-ad/sd-webui-bilingual-localization
catppuccin	界面个性化设置	https://github.com/catppuccin/stable-diffusion-webui
gelbooru-prompt	Gelbooru标签自动摘录	https://github.com/antis0007/sd-webui-gelbooru-prompt
model-converter	模型格式转换	https://github.com/Akegarasu/sd-webui-model-converter
multiple-hypernetworks	多超网络加载	https://github.com/antis0007/sd-webui-multiple-hypernetworks
posex	3D OpenPose 编辑器(Posex)	https://github.com/hnmr293/posex
xyplus	X/Y图表 Plus 插件	https://github.com/bbc-mc/sdweb-xyplus

采样方法区别

Gamma一键生成PPT内测链接

https://gamma.app/signup?r=sqgovd3iif5btr4

往期精彩内容

逼真3D场景程序生成器「Infinigen」AI生成100%还原大自然

百度官方AIGC交流群领取GPU算力.Prompt提示词教学

有奖征文:大胆猜测AI大时代头部企业的下一步动作

被你严重低估的 Gamma AI一键生成PPT 我当chatGPT来用

被骂了--开源这件难事

今年这个情况我劝你先别跳槽

LeiaPix 让你的图片动起来一键转为3D

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入