AI作画Stable Diffusion的1.0版本的操作教程来了

举报
码上开花_Lancer 发表于 2024/06/11 11:06:36 2024/06/11
【摘要】 文章目录前言一、西方艺术简史1.1、古典艺术时期1.2、现代艺术时期1.3、后现代艺术时期二、数字艺术的诞生和发展2.1、数字艺术的诞生2.2、数字艺术下的行业细分2.3、数字作品的创作过程2.4、AI 作画诞生三、Stable Diffusion 文字生成图像3.1、实验环境准备3.2、什么是 Stable Diffusion?四、Stable Diffusion Pipeline 使用方...


文章目录

  • 前言
  • 一、西方艺术简史
    • 1.1、古典艺术时期
    • 1.2、现代艺术时期
    • 1.3、后现代艺术时期
  • 二、数字艺术的诞生和发展
    • 2.1、数字艺术的诞生
    • 2.2、数字艺术下的行业细分
    • 2.3、数字作品的创作过程
    • 2.4、AI 作画诞生
  • 三、Stable Diffusion 文字生成图像
    • 3.1、实验环境准备
    • 3.2、什么是 Stable Diffusion?
  • 四、Stable Diffusion Pipeline 使用方法
    • 4.1、安装需要的运行环境
    • 4.2、下载 AI 模型预训练权重文件,加载模型
    • 4.3、生成单张图像
    • 4.4、海报生成和分享
    • 4.5、生成多张图像
  • 五、修改 Prompt 提示词
    • 5.1、什么是 Prompt?
    • 5.2、如何修改 Promot?
    • 5.3、Prompt 新手指导
  • 六、附录及参考材料提供
    • 6.1、常见的风格列举
    • 6.2、其他参考材料


前言

Hi,各位 AI 小伙伴,相信大家最近被各种 AI 作画的消息刷屏,有没有手痒痒的朋友也想赶紧来把自己的奇思妙想实现出来?机会来啦!AI Gallery 正式上线了 AI 作画中最火的模型 “Stable Diffusion”,通过 ModelArts Notebook 能力,即可实现【一键 AI 作画】,自动生成作品海报,人人都是大艺术家!Stable Diffusion 是由 CompVis、Stability AI 和 LAION 共同开发的一个文本转图像模型,它通过 LAION-5B 子集大量的 512x512 图文模型进行训练,我们只要简单的输入一段文本,Stable Diffusion 就可以迅速将其转换为图像,同样我们也可以置入图片或视频,配合文本对其进行处理。


1.jpg




一、西方艺术简史

在进行 AI 作画之前,我们先了解一下西方的艺术简史,以便于后面了解绘画生成风格。

1.1、古典艺术时期

2 世纪到 19 世纪为西方古典艺术时期,代表类型与作品形式具体如下图所示:


2.png



  • 古典主义:巴洛克、洛可可
  • 新古典主义:浪漫主义、写实主义
  • 达芬奇,拉斐尔,丢勒

1.2、现代艺术时期

19 世纪末到 20 世纪末为现代艺术时期,代表类型与作品形式具体如下图所示:


3.png



  • 现代艺术,印象派,分水岭
  • 莫奈,梵高

1.3、后现代艺术时期

20 世纪至今为后现代艺术时期,代表类型与作品形式具体如下图所示:


4.png



  • 现代艺术、后现代艺术、绘画、行为艺术、装置艺术、约瑟夫-博伊斯、超现实主义、抽象主义、极简主义、表现主义

二、数字艺术的诞生和发展

2.1、数字艺术的诞生

随着计算机的出现,人们开始运用数字技术和计算机进行艺术创作。作品应用于影视、游戏、动漫、建筑,服装等领域,具体如下图所示:


5.png



2.2、数字艺术下的行业细分

数字艺术涉及到千行百业,如:影视、游戏、动漫、图书、服装、舞台、建筑、装饰、珠宝等等,举例相关作品具体如下图所示:


6.png


同时在行业中也衍生了许多相关岗位,如:影视概念设计、影视海报设计、影视角色设计、游戏海报设计、游戏场景设计、游戏角色设计、动漫设计、插画设计、平面设计等,其相关作品具体如下图所示:



7.png



2.3、数字作品的创作过程

数字作品的创作过程包括:在创作前进行大量的素材搜集、参考搜集,创作中需要基于素材参考图片,人发挥想象力,使用计算机和数位板进行手绘创作直到数字作品创作完成,创作过程具体如下图所示:


8.png



2.4、AI 作画诞生

AI(Artificial Intelligence):人工智能。

Al 的最终目的是构建与人类相似的推理、知识、规划、学习、交流、感知、使用工具和操控机械得能力等


9.png


AI 作画:是对上亿张图像数据库进行采集整理,成立数据库,根据文本描述指令,创作数字图像作品。所以我们在运用 AI 作画时,描述词尤为重要,是与 AI 对话的语言工具


下面为大家带来几幅通过不同描述词生成的不同风格的 AI 画作供大家鉴赏,具体如下图所示:

10.png

三、Stable Diffusion 文字生成图像

3.1 实验环境准备

1.登录华为云账号,没有账号请参考文章华为云账号注册和实名认证.

2.打开浏览器新窗口,点击案例链接AI 作画 文字生成图片Stable Diffusion进入AI Gallery 案例页面:

1)检查是否已经实名认证,如果没有请输入姓名和身份证号,人脸识别进行实名认证。

2)需要签署开发者协议。

3.以上确认没有问题,请点击Run in ModelArts,进入codelab jupyter 页面。


如果想要快速知道案例怎么运行也可以直接参考视频:【一键使用华为云AI作画ModelArts体验Stable Diffusion】

4.点击用户授权-立即授权



1)看到右上角出现时间倒计时表示进入到案例页面:

2)等倒计时为0,选择下面的GPU规格-切换规格。


3)等待时间倒计时为0,出现资源切换完成提示-点击确定

切换成功可以看到:

4)点击下面的按钮,显示下面规格表示切换成功。

PS:这种规格是限时免费使用,每人每天可以使用2小时。


5)选择kernel-Pytorch-1.8环境



6)查看1-14当前页面按钮的意义:

1-   保存此jupyter lab文件 

2-  + 表示增加代码行

3-  剪切代码行 4-复制代码行

5-  粘贴代码行

6-  运行当前代码 

7-   停止当前代码行

8-  重启代码行

9-  全局执行代码

10-   jupyter 文件的三种格式,Code-表示写代码,Markdown-表示传图片,写注释

11- 切换Laucher页面 ,包含终端Terminal和各种环境的Notebook 

12 - 新建文件夹

13-  上传文件

14 -  刷新当前所在的文件目录


7)代码运行的五种状态:

鼠标指着三角行 表示运行,出现时间表示运行成功,出现红色表示报错,转圈表示正在运行,如果表示转圈不要再点其他代码运行。表示代码正在运行,千万不要再次点击。



3.2、什么是 Stable Diffusion?

什么是 Stable Diffusion?

Stable Diffusion 是由 CompVis、Stability AI 和 LAION 共同开发的一个文本转图像模型,它通过 LAION-5B 子集大量的 512x512 图文模型进行训练,我们只要简单的输入一段文本,Stable Diffusion 就可以迅速将其转换为图像,同样我们也可以置入图片或视频,配合文本对其进行处理。

四、Stable Diffusion Pipeline 使用方法

本案例可以使用 GPU,也可以使用 CPU 来运行,GPU 生成单张图片约 20 秒,CPU 需 6 分钟。您可以使用命令来查询当前机器的 GPU 是否可用,如果运行结果是一个表格,则表示 GPU 可用,实现命令如下:

!nvidia-smi

!pip install --upgrade pip
!pip install torch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1
!pip install diffusers==0.2.4
!pip install transformers==4.21.1 scipy==1.7.3 ftfy==6.1.1
!pip install "ipywidgets>=7,<8"

import os
import torch
import os.path as osp
import moxing as mox
from diffusers import StableDiffusionPipeline
parent = osp.join(os.getcwd(),'CompVis')
if not os.path.exists(parent):
    mox.file.copy_parallel('obs://modelarts-labs-bj4-v2/case_zoo/StableDiffusion/CompVis',parent)
    if os.path.exists(parent):
        print('Download success')
    else:
        raise Exception('Download Failed')
else:

运行完可以看到出现“Download success”,刷新右边可以看到“CompVis”文件夹。

加载模型


model_dir = osp.join(osp.join(parent,'stable-diffusion-v1-4'), "diffusers")
os.environ["XDG_CACHE_HOME"] = model_dir
device = 'cuda' if torch.cuda.is_available() else 'cpu'
pipe = StableDiffusionPipeline.from_pretrained(model_dir,
                                               # revision="fp16",
                                               # torch_dtype=torch.float16
                                              ).to(device) 


prompt::“Cygames girl character concept art and illustration by akihiko yoshida , ultimate dressy , amazing detailed face in profile closeup, galaxy in blue hair, Jewelry eyes , wearing a white galaxy dress , Line Array Speaker , Extreme Explosion , Subwoofer , kyoani character face , cute ,pretty girl , dynamic pose, portrait , pixiv daily ranking , pixiv , artstation ,specatcualr details, Volumetric Lighting , Dramatic lighting —ar 9:16 --test --creative --upbeta

填写替换自己的英文提示词,然后点击代码运行:

4.4 生成海报

点击运行代码,下载代码,可以查看有下载Style文件夹


点击运行代码生成海报:


4.5 步骤四:生成多张图像


五、修改 Prompt 提示词

5.1、什么是 Prompt?

Prompt 是生成图片的提示词,可以是一个实体,例如猫,也可以是一串富含想象力的文字,例如:『夕阳日落时,天边有巨大的云朵,海面波涛汹涌,风景,胶片感』。不同的 Prompt 对于生成的图像质量影响非常大,所以如果要生成一幅优秀的图画,就要掌握写 Prompt 的一些经验性技巧。

以下是一些优秀图画及相关 Promot 的示范样例。

Promot:Cygames girl character concept art and illustration by akihiko yoshida , ultimate dressy , amazing detailed face in profile closeup, galaxy in blue hair, Jewelry eyes , wearing a white galaxy dress , Line Array Speaker , Extreme Explosion , Subwoofer , kyoani character face , cute ,pretty girl , dynamic pose, portrait , pixiv daily ranking , pixiv , artstation ,specatcualr details, Volumetric Lighting , Dramatic lighting —ar 9:16 --test --creative --upbeta

Cygames 女孩角色概念艺术和插图由 akihiko yoshida,终极打扮,惊人的详细的脸在侧面特写,银河在蓝色头发,珠宝眼睛,穿着白色银河礼服,线阵列扬声器,极端爆炸,低低音,kyoani 字符脸,可爱,漂亮的女孩,动态姿势,肖像,pixiv 日常排名,pixiv,artstation,壮观的细节,体积照明,戏剧照明-ar 9:16 -测试-创意-upbeta

实现效果具体如下图所示:


Promot:dark style painted, river flowing through forest of cherry blossom trees , under a galaxy filled sky, beautiful, galaxies, deep colors,ultra lighting, Bioelectric Modular Synthesizer, perfect symmetry, cinematic, volumetric lighting, --ar 9:16

黑色画风,河流流经樱花树林,在一个充满星系的天空下,美丽,星系,深的颜色,超照明,生物电模块合合器,完美的对称,电影,体积照明,——ar 9:16

实现效果具体如下图所示:

16.png

5.2、如何修改 Promot?

如何设计 Prompt,我们将通过 4 个方面来说明:图片的风格,内容主体,详细的描述,再加上画家的风格。需要注意的是,这里的 Prompt 公式仅仅是个入门级别的参考,是经验的简单总结,在熟悉了 Prompt 的原理之后,可以尽情的发挥脑洞修改 Prompt。

Prompt 公式框架:[图片的风格]+[内容主题]+[细节描述]+[绘画风格或者艺术家风格]

图片的风格按照这个框架,简单构造一个图片风格,比如:可以是一幅美丽的画,或者是一幅美丽的山水画。内容的主体 + 详细描述主体可以是各种各样的选择。推荐一些可以激发大家灵感的事物,如山水,人物,建筑房屋,动物等等,尽可能细致刻画这些实体事物。如果是简单的输入“大海”两个字,模型不知道我们想要的风景是什么样子的,一段作品的相对准确的描述,比如:梦幻的大海,白沙滩岸边铺满了粉色的玫瑰花,月光轻柔的人洒在海面上,绿色发光的海浪,我们要去尽量用详细的语言,用细节清楚的描述我们幻想的场景。比如:云中的 Skyrim 风格的山,有一个照明螺栓击中尖端导致雪崩,山区风景,实现效果具体如下图所示:

17.jpg

5.3、Prompt 新手指导

如果你是个新手,需要一些关于关键词的引导,那你可以去 https://lexica.art/ 这个网站看一看。它收集了很多关键词,并且一步一步、分门别类地为你整理好了。你只需要根据网站给出的步骤,从它的关键词库里选择你想要的效果,然后把这串关键词直接复制到 Prompt 里就好,把“填空题”变成“选择题”,非常方便,具体如下图所示:

18.jpg


在熟悉了 Prompt 的原理之后,就可以尽情的发挥脑洞修改它的写法,点击链接,快来 Happy Prompting 吧!

六、附录及参考材料提供

6.1、常见的风格列举

为了便于大家创作,在这里为大家提供常见的风格列举:古典主义、洛可可、巴洛克、印象派、新古典主义、写实主义、浪漫主义、唯美主义、表现主义、现实主义、魔幻现实主义、奇幻现实主义、象征主义、抽象主义、超扁平主义、超前卫艺术、中国风格、浮世绘、极简主义、几何风格、数字艺术、感念艺术、装饰艺术、复古未来主义风格、粉彩朋克风格、史前遗迹风格、波普艺术风格、迷幻风格、赛博朋克风格、未来主义风格、抽象技术风格、新艺术主义、抽象表现主义、北欧文艺复兴、原始主义、立体主义、色域绘画、波普艺术、极简主义、矫饰主义。

6.2、其他参考材料

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。