- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

AI作画Stable Diffusion的1.0版本的操作教程来了

码上开花_Lancer 发表于 2024/06/11 11:06:36 2024/06/11

【摘要】文章目录前言一、西方艺术简史1.1、古典艺术时期1.2、现代艺术时期1.3、后现代艺术时期二、数字艺术的诞生和发展2.1、数字艺术的诞生2.2、数字艺术下的行业细分2.3、数字作品的创作过程2.4、AI 作画诞生三、Stable Diffusion 文字生成图像3.1、实验环境准备3.2、什么是 Stable Diffusion？四、Stable Diffusion Pipeline 使用方...

文章目录

前言
一、西方艺术简史

1.1、古典艺术时期
1.2、现代艺术时期
1.3、后现代艺术时期

二、数字艺术的诞生和发展

2.1、数字艺术的诞生
2.2、数字艺术下的行业细分
2.3、数字作品的创作过程
2.4、AI 作画诞生

三、Stable Diffusion 文字生成图像

3.1、实验环境准备
3.2、什么是 Stable Diffusion？

四、Stable Diffusion Pipeline 使用方法

4.1、安装需要的运行环境
4.2、下载 AI 模型预训练权重文件，加载模型
4.3、生成单张图像
4.4、海报生成和分享
4.5、生成多张图像

五、修改 Prompt 提示词

5.1、什么是 Prompt？
5.2、如何修改 Promot？
5.3、Prompt 新手指导

六、附录及参考材料提供

6.1、常见的风格列举
6.2、其他参考材料

前言

Hi，各位 AI 小伙伴，相信大家最近被各种 AI 作画的消息刷屏，有没有手痒痒的朋友也想赶紧来把自己的奇思妙想实现出来？机会来啦！AI Gallery 正式上线了 AI 作画中最火的模型 “Stable Diffusion”，通过 ModelArts Notebook 能力，即可实现【一键 AI 作画】，自动生成作品海报，人人都是大艺术家！Stable Diffusion 是由 CompVis、Stability AI 和 LAION 共同开发的一个文本转图像模型，它通过 LAION-5B 子集大量的 512x512 图文模型进行训练，我们只要简单的输入一段文本，Stable Diffusion 就可以迅速将其转换为图像，同样我们也可以置入图片或视频，配合文本对其进行处理。

一、西方艺术简史

在进行 AI 作画之前，我们先了解一下西方的艺术简史，以便于后面了解绘画生成风格。

1.1、古典艺术时期

2 世纪到 19 世纪为西方古典艺术时期，代表类型与作品形式具体如下图所示：

古典主义：巴洛克、洛可可
新古典主义：浪漫主义、写实主义
达芬奇，拉斐尔，丢勒

1.2、现代艺术时期

19 世纪末到 20 世纪末为现代艺术时期，代表类型与作品形式具体如下图所示：

现代艺术，印象派，分水岭
莫奈，梵高

1.3、后现代艺术时期

20 世纪至今为后现代艺术时期，代表类型与作品形式具体如下图所示：

现代艺术、后现代艺术、绘画、行为艺术、装置艺术、约瑟夫-博伊斯、超现实主义、抽象主义、极简主义、表现主义

二、数字艺术的诞生和发展

2.1、数字艺术的诞生

随着计算机的出现，人们开始运用数字技术和计算机进行艺术创作。作品应用于影视、游戏、动漫、建筑，服装等领域，具体如下图所示：

2.2、数字艺术下的行业细分

数字艺术涉及到千行百业，如：影视、游戏、动漫、图书、服装、舞台、建筑、装饰、珠宝等等，举例相关作品具体如下图所示：

同时在行业中也衍生了许多相关岗位，如：影视概念设计、影视海报设计、影视角色设计、游戏海报设计、游戏场景设计、游戏角色设计、动漫设计、插画设计、平面设计等，其相关作品具体如下图所示：

2.3、数字作品的创作过程

数字作品的创作过程包括：在创作前进行大量的素材搜集、参考搜集，创作中需要基于素材参考图片，人发挥想象力，使用计算机和数位板进行手绘创作直到数字作品创作完成，创作过程具体如下图所示：

2.4、AI 作画诞生

AI（Artificial Intelligence）：人工智能。

Al 的最终目的是构建与人类相似的推理、知识、规划、学习、交流、感知、使用工具和操控机械得能力等。

AI 作画：是对上亿张图像数据库进行采集整理，成立数据库，根据文本描述指令，创作数字图像作品。所以我们在运用 AI 作画时，描述词尤为重要，是与 AI 对话的语言工具。

下面为大家带来几幅通过不同描述词生成的不同风格的 AI 画作供大家鉴赏，具体如下图所示：

三、Stable Diffusion 文字生成图像

3.1 实验环境准备

1.登录华为云账号，没有账号请参考文章华为云账号注册和实名认证.

2.打开浏览器新窗口，点击案例链接AI 作画文字生成图片Stable Diffusion进入AI Gallery 案例页面：

1）检查是否已经实名认证，如果没有请输入姓名和身份证号，人脸识别进行实名认证。

2）需要签署开发者协议。

3.以上确认没有问题，请点击Run in ModelArts,进入codelab jupyter 页面。

如果想要快速知道案例怎么运行也可以直接参考视频：【一键使用华为云AI作画ModelArts体验Stable Diffusion】

4.点击用户授权-立即授权

1）看到右上角出现时间倒计时表示进入到案例页面：

2）等倒计时为0,选择下面的GPU规格-切换规格。

3）等待时间倒计时为0，出现资源切换完成提示-点击确定。

切换成功可以看到：

4）点击下面的按钮，显示下面规格表示切换成功。

PS:这种规格是限时免费使用，每人每天可以使用2小时。

5）选择kernel-Pytorch-1.8环境

6）查看1-14当前页面按钮的意义：

1- 保存此jupyter lab文件

2- + 表示增加代码行

3- 剪切代码行 4-复制代码行

5- 粘贴代码行

6- 运行当前代码

7- 停止当前代码行

8- 重启代码行

9- 全局执行代码

10- jupyter 文件的三种格式，Code-表示写代码，Markdown-表示传图片，写注释

11- 切换Laucher页面，包含终端Terminal和各种环境的Notebook

12 - 新建文件夹

13- 上传文件

14 - 刷新当前所在的文件目录

7）代码运行的五种状态：

鼠标指着三角行表示运行，出现时间表示运行成功，出现红色表示报错，转圈表示正在运行，如果表示转圈不要再点其他代码运行。表示代码正在运行，千万不要再次点击。

3.2、什么是 Stable Diffusion？

什么是 Stable Diffusion？

Stable Diffusion 是由 CompVis、Stability AI 和 LAION 共同开发的一个文本转图像模型，它通过 LAION-5B 子集大量的 512x512 图文模型进行训练，我们只要简单的输入一段文本，Stable Diffusion 就可以迅速将其转换为图像，同样我们也可以置入图片或视频，配合文本对其进行处理。

四、Stable Diffusion Pipeline 使用方法

本案例可以使用 GPU，也可以使用 CPU 来运行，GPU 生成单张图片约 20 秒，CPU 需 6 分钟。您可以使用命令来查询当前机器的 GPU 是否可用，如果运行结果是一个表格，则表示 GPU 可用，实现命令如下：

!nvidia-smi

!pip install --upgrade pip
!pip install torch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1
!pip install diffusers==0.2.4
!pip install transformers==4.21.1 scipy==1.7.3 ftfy==6.1.1
!pip install "ipywidgets>=7,<8"

import os
import torch
import os.path as osp
import moxing as mox
from diffusers import StableDiffusionPipeline
parent = osp.join(os.getcwd(),'CompVis')
if not os.path.exists(parent):
    mox.file.copy_parallel('obs://modelarts-labs-bj4-v2/case_zoo/StableDiffusion/CompVis',parent)
    if os.path.exists(parent):
        print('Download success')
    else:
        raise Exception('Download Failed')
else:

运行完可以看到出现“Download success”,刷新右边可以看到“CompVis”文件夹。

加载模型

model_dir = osp.join(osp.join(parent,'stable-diffusion-v1-4'), "diffusers")
os.environ["XDG_CACHE_HOME"] = model_dir
device = 'cuda' if torch.cuda.is_available() else 'cpu'
pipe = StableDiffusionPipeline.from_pretrained(model_dir,
                                               # revision="fp16",
                                               # torch_dtype=torch.float16
                                              ).to(device)

请在此处填写Prompt，运行，即可生成单张图像

prompt:：“Cygames girl character concept art and illustration by akihiko yoshida , ultimate dressy , amazing detailed face in profile closeup, galaxy in blue hair, Jewelry eyes , wearing a white galaxy dress , Line Array Speaker , Extreme Explosion , Subwoofer , kyoani character face , cute ,pretty girl , dynamic pose, portrait , pixiv daily ranking , pixiv , artstation ,specatcualr details, Volumetric Lighting , Dramatic lighting —ar 9:16 --test --creative --upbeta”

填写替换自己的英文提示词，然后点击代码运行：

4.4 生成海报

点击运行代码，下载代码，可以查看有下载Style文件夹

点击运行代码生成海报：

4.5 步骤四：生成多张图像

五、修改 Prompt 提示词

5.1、什么是 Prompt？

Prompt 是生成图片的提示词，可以是一个实体，例如猫，也可以是一串富含想象力的文字，例如：『夕阳日落时，天边有巨大的云朵，海面波涛汹涌，风景，胶片感』。不同的 Prompt 对于生成的图像质量影响非常大，所以如果要生成一幅优秀的图画，就要掌握写 Prompt 的一些经验性技巧。

以下是一些优秀图画及相关 Promot 的示范样例。

Promot：Cygames girl character concept art and illustration by akihiko yoshida , ultimate dressy , amazing detailed face in profile closeup, galaxy in blue hair, Jewelry eyes , wearing a white galaxy dress , Line Array Speaker , Extreme Explosion , Subwoofer , kyoani character face , cute ,pretty girl , dynamic pose, portrait , pixiv daily ranking , pixiv , artstation ,specatcualr details, Volumetric Lighting , Dramatic lighting —ar 9:16 --test --creative --upbeta

Cygames 女孩角色概念艺术和插图由 akihiko yoshida，终极打扮，惊人的详细的脸在侧面特写，银河在蓝色头发，珠宝眼睛，穿着白色银河礼服，线阵列扬声器，极端爆炸，低低音，kyoani 字符脸，可爱，漂亮的女孩，动态姿势，肖像，pixiv 日常排名，pixiv，artstation，壮观的细节，体积照明，戏剧照明-ar 9:16 -测试-创意-upbeta

实现效果具体如下图所示：

Promot：dark style painted, river flowing through forest of cherry blossom trees , under a galaxy filled sky, beautiful, galaxies, deep colors,ultra lighting, Bioelectric Modular Synthesizer, perfect symmetry, cinematic, volumetric lighting, --ar 9:16

黑色画风，河流流经樱花树林，在一个充满星系的天空下，美丽，星系，深的颜色，超照明，生物电模块合合器，完美的对称，电影，体积照明，——ar 9:16

实现效果具体如下图所示：

5.2、如何修改 Promot？

如何设计 Prompt，我们将通过 4 个方面来说明：图片的风格，内容主体，详细的描述，再加上画家的风格。需要注意的是，这里的 Prompt 公式仅仅是个入门级别的参考，是经验的简单总结，在熟悉了 Prompt 的原理之后，可以尽情的发挥脑洞修改 Prompt。

Prompt 公式框架：[图片的风格]+[内容主题]+[细节描述]+[绘画风格或者艺术家风格]

图片的风格按照这个框架，简单构造一个图片风格，比如：可以是一幅美丽的画，或者是一幅美丽的山水画。内容的主体 + 详细描述主体可以是各种各样的选择。推荐一些可以激发大家灵感的事物，如山水，人物，建筑房屋，动物等等，尽可能细致刻画这些实体事物。如果是简单的输入“大海”两个字，模型不知道我们想要的风景是什么样子的，一段作品的相对准确的描述，比如：梦幻的大海，白沙滩岸边铺满了粉色的玫瑰花，月光轻柔的人洒在海面上，绿色发光的海浪，我们要去尽量用详细的语言，用细节清楚的描述我们幻想的场景。比如：云中的 Skyrim 风格的山，有一个照明螺栓击中尖端导致雪崩，山区风景，实现效果具体如下图所示：

5.3、Prompt 新手指导

如果你是个新手，需要一些关于关键词的引导，那你可以去 https://lexica.art/ 这个网站看一看。它收集了很多关键词，并且一步一步、分门别类地为你整理好了。你只需要根据网站给出的步骤，从它的关键词库里选择你想要的效果，然后把这串关键词直接复制到 Prompt 里就好，把“填空题”变成“选择题”，非常方便，具体如下图所示：

在熟悉了 Prompt 的原理之后，就可以尽情的发挥脑洞修改它的写法，点击链接，快来 Happy Prompting 吧！

六、附录及参考材料提供

6.1、常见的风格列举

为了便于大家创作，在这里为大家提供常见的风格列举：古典主义、洛可可、巴洛克、印象派、新古典主义、写实主义、浪漫主义、唯美主义、表现主义、现实主义、魔幻现实主义、奇幻现实主义、象征主义、抽象主义、超扁平主义、超前卫艺术、中国风格、浮世绘、极简主义、几何风格、数字艺术、感念艺术、装饰艺术、复古未来主义风格、粉彩朋克风格、史前遗迹风格、波普艺术风格、迷幻风格、赛博朋克风格、未来主义风格、抽象技术风格、新艺术主义、抽象表现主义、北欧文艺复兴、原始主义、立体主义、色域绘画、波普艺术、极简主义、矫饰主义。

6.2、其他参考材料

Prompt搜索引擎：https://lexica.art/
两个 Prompts 插值：https://replicate.com/andreasjansson/stable-diffusion-animation
生成无缝贴图：https://withpoly.com/
用 Stable Diffusion 生成的艺术家风格参考库：https://proximacentaurib.notion.site/e2537cbf42c34b7e9a9a4126f81dfd0d?v=7b4a3c03fb654045be324eb71acc57e6

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

AI作画Stable Diffusion的1.0版本的操作教程来了

文章目录

前言

一、西方艺术简史

1.1、古典艺术时期

1.2、现代艺术时期

1.3、后现代艺术时期

二、数字艺术的诞生和发展

2.1、数字艺术的诞生

2.2、数字艺术下的行业细分

2.3、数字作品的创作过程

2.4、AI 作画诞生

三、Stable Diffusion 文字生成图像

3.1 实验环境准备

3.2、什么是 Stable Diffusion？

四、Stable Diffusion Pipeline使用方法

4.1 步骤一：安装需要的运行环境

4.2 步骤二：下载AI模型预训练权重文件，加载模型

加载模型

4.3 步骤三：生成单张图像

4.4 生成海报

4.5 步骤四：生成多张图像

五、修改 Prompt 提示词

5.1、什么是 Prompt？

5.2、如何修改 Promot？

5.3、Prompt 新手指导

六、附录及参考材料提供

6.1、常见的风格列举

6.2、其他参考材料

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

AI作画Stable Diffusion的1.0版本的操作教程来了

文章目录

前言

一、西方艺术简史

1.1、古典艺术时期

1.2、现代艺术时期

1.3、后现代艺术时期

二、数字艺术的诞生和发展

2.1、数字艺术的诞生

2.2、数字艺术下的行业细分

2.3、数字作品的创作过程

2.4、AI 作画诞生

三、Stable Diffusion 文字生成图像

3.1 实验环境准备

3.2、什么是 Stable Diffusion？

四、Stable Diffusion Pipeline使用方法

4.1 步骤一：安装需要的运行环境

4.2 步骤二：下载AI模型预训练权重文件，加载模型

加载模型

4.3 步骤三： 生成单张图像

4.4 生成海报

4.5 步骤四：生成多张图像

五、修改 Prompt 提示词

5.1、什么是 Prompt？

5.2、如何修改 Promot？

5.3、Prompt 新手指导

六、附录及参考材料提供

6.1、常见的风格列举

6.2、其他参考材料

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品

4.3 步骤三：生成单张图像