- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

通过文生图大模型生成兔年专属美甲

李长安发表于 2023/02/16 19:37:29 2023/02/16

【摘要】虚拟试妆也越来越普遍了，恰好手里有指甲分割的数据集，就尝试着玩了玩。使用文心大模型生成自己想要的兔年专属美甲图案，主要基于PaddleSeg套件、文心大模型进行开发

通过文生图大模型生成兔年专属美甲

本文章最初的灵感来源于旷视放出来的虚拟试妆，实际上在美妆行业，虚拟试妆也越来越普遍了，恰好手里有指甲分割的数据集，就尝试着玩了玩。使用文心大模型生成自己想要的兔年专属美甲图案，主要基于PaddleSeg套件、文心大模型进行开发，最终的效果如下图所示：

1、技术路线

考虑到，故在此选择了pp_liteseg作为网络模型解决方案，对指甲部分进行分割，考虑到线上试妆颜色的真实性，不同于其他的图像分割，这里不能将指甲的分割区域进行简单的颜色填充，需要考虑分割部分指甲部位的亮度等真实指甲的特征，本项目中对分割部分的HSV进行调整，准确来说是对饱和度（S）、亮度（V）进行调整，保留真实指甲特征的同时更改颜色，达到虚拟试妆的效果。

1.1 数据集预处理

根据PaddleSeg中的数据标注方式，在这里，我们需要将数据集进行预处理，将标注区域的像素更改为1，因为此图像分割任务中只包含指甲一个类别。

import numpy as np
import os
import cv2

np.set_printoptions(threshold=np.inf)

images_path = 'data/data166460/Nails/JPEGImages'
masks_path = 'data/data166460/Nails/SegmentationClass'
masked_path = 'data/data166460/Nails/SegmentationClass_masked'

os.makedirs(masked_path)


for img_item in os.listdir(images_path):
    # print(img_item)
    img_path = os.path.join(images_path, img_item)
    img = cv2.imread(img_path)
    mask_path = os.path.join(masks_path, img_item[:-4]+'.png')  # mask是.png格式的
    mask = cv2.imread(mask_path, cv2.IMREAD_GRAYSCALE)  # 将彩色mask以二值图像形式读取
    mask[mask > 0] = 1
    # print(mask)

    cv2.imwrite(os.path.join(masked_path, img_item), mask)

1.2 数据集探索分析

探索性数据分析（Exploratory Data Analysis，简称EDA），是指对已有的数据（原始数据）进行分析探索，通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。一般来说，我们最初接触到数据的时候往往是毫无头绪的，不知道如何下手，这时候探索性数据分析就非常有效。

%matplotlib inline

import os
import cv2
import random

from tqdm import tqdm

import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt



TRAIN = 'data/data166460/Nails/JPEGImages'

train = os.listdir(TRAIN)

f, axs = plt.subplots(4,5, figsize=(16,8))
for i in range(4):
    for j in range(5):
        axs[i][j].imshow(cv2.cvtColor(cv2.imread(os.path.join(TRAIN, train[random.randint(0,len(train)-1)]), cv2.IMREAD_UNCHANGED), cv2.COLOR_BGR2RGB));

2、模型训练

本模型后续部署在小型设备上，故在此选择了一个轻量级网络pp_liteseg_optic_disc_512x512_1k作为分割模型，其配置文件在路径

PaddleSeg/configs/quick_start/pp_liteseg_optic_disc_512x512_1k.yml

模型整体还是采用跳层连接结构，引入了统一注意力融合模块（空间和通道注意力机制）、金字塔模块来聚合上下文。

2.1 不使用文心大模型的后处理效果

通过对结果进行后处理，生成AI美妆结果。在这里给出模型预测结果以及经过后处理之后的结果。其中左侧的为经过后处理之后的图片，右侧的为模型输出的结果。通过对比我们可以发现，经过后处理的图片，指甲部分的亮度都被保存，整体的效果要强于模型直接的生成结果。

mask_res_path = 'PaddleSeg/output/result/pseudo_color_prediction/1eecab90-1a92-43a7-b952-0204384e1fae.png'

mask_test_path = 'data/data166460/Nails/SegmentationClass_masked/1eecab90-1a92-43a7-b952-0204384e1fae.png'

img = cv2.imread(ori_path)
mask_img = cv2.imread(mask_test_path, cv2.IMREAD_GRAYSCALE)

img = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
img[mask_img > 0,0] = 200
img = cv2.cvtColor(img, cv2.COLOR_HSV2BGR)

cv2.imwrite('PaddleSeg/output/result/res.jpg', img)

3.2 使用文心大模型的后处理效果

! pip install wenxin_api
import wenxin_api # 可以通过"pip install wenxin-api"命令安装
from wenxin_api.tasks.text_to_image import TextToImage


wenxin_api.ak = ""
wenxin_api.sk = ""


input_dict = {
    "text": '动漫，兔子，新年' + "超高清，超细节，唯美，插画，壁纸",
    "style": "古风", #解锁更多风格后，非必选参数
    "resolution":"1024*1536" , #也可设置为 1024*1536、1536*1024
    "num": "1",    #功能解锁后，可设置的范围为[1,2,3,4,5,6]
}
rst = TextToImage.create(**input_dict)

!pip install wget
import wget

wget.download(rst['imgUrls'][0], 'source1.jpg')

import cv2
import numpy as np

# 读取图片
img_dir = 'data/data166460/Nails/JPEGImages/1eecab90-1a92-43a7-b952-0204384e1fae.png'
mask_dir = 'data/data166460/Nails/SegmentationClass/1eecab90-1a92-43a7-b952-0204384e1fae.png'

source_dir = 'source.jpg'

img = cv2.imread(img_dir)
mask = cv2.imread(mask_dir)[:,:,0]

# cv2.imwrite('now_img.jpg',img)
# cv2.imwrite('now_mask.jpg',mask*255)

mask = mask.astype('float32')
hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV).astype('float32')

source = cv2.imread(source_dir)
source = cv2.resize(source, (hsv.shape[1], hsv.shape[0]))
hsv_source = cv2.cvtColor(source, cv2.COLOR_BGR2HSV).astype('float32')

h_mid = np.median(hsv[mask>0,0])
s_mid = np.median(hsv[mask>0,1])
v_mid = np.median(hsv[mask>0,2])
hsv_mid = np.array([h_mid, s_mid, v_mid]).astype('float32')

hsv[mask>0,0] = (hsv[mask>0,0] - hsv_mid[0] + hsv_source[mask>0,0])
hsv[mask>0,1] = (hsv[mask>0,1] - hsv_mid[1] + hsv_source[mask>0,1]) # *0.5 + hsv[mask>0,1]*0.5

hsv[hsv[:,:,0]>179,0] = 179
hsv[hsv[:,:,0]<0,0] = 0
hsv[hsv[:,:,1]>255,1] = 255
hsv[hsv[:,:,1]<0,1] = 0

result = cv2.cvtColor(hsv.astype('uint8'), cv2.COLOR_HSV2BGR)

cv2.imwrite('result.jpg',result)

3、总结

项目通过文心大模型、PaddleSeg套件完成了AI美甲，但是还有很多提升的地方，例如指甲边缘的处理，仔细看的话，目前的效果对于指甲边缘的处理不是特别好；其次，是文心大模型生成的图片，可以有更适合美甲的图片，这个需要大家去调整Promot，最后祝大家新春快乐。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

通过文生图大模型生成兔年专属美甲

通过文生图大模型生成兔年专属美甲

1、技术路线

1.1 数据集预处理

1.2 数据集探索分析

2、模型训练

2.1 不使用文心大模型的后处理效果

3.2 使用文心大模型的后处理效果

3、总结

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

通过文生图大模型生成兔年专属美甲

通过文生图大模型生成兔年专属美甲

1、技术路线

1.1 数据集预处理

1.2 数据集探索分析

2、模型训练

2.1 不使用文心大模型的后处理效果

3.2 使用文心大模型的后处理效果

3、总结

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品