- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

绘制一切

雨落无痕发表于 2023/07/06 15:16:21 2023/07/06

【摘要】绘制一切-Inpaint Anything相关链接：Notebook案例地址：绘制一切AI Gallery：https://developer.huaweicloud.com/develop/aigallery/home.html也可通过AI Gallery，搜索【绘制一切】一键体验！Inpaint Anything通过一键点击标记选定对象，即可实现移除指定对象、填补指定对象、替换一切场景，...

绘制一切-Inpaint Anything

Inpaint Anything

通过一键点击标记选定对象，即可实现移除指定对象、填补指定对象、替换一切场景，涵盖了包括目标移除、目标填充、背景替换等在内的多种典型图像修补应用场景。

它的整体框架如图所示：

Inpaint Anything工作原理

Inpaint Anything结合了 SAM、图像修补模型（例如 LaMa）和 AIGC 模型（例如 Stable Diffusion）等视觉基础模型。

SAM（Segment Anything Model）可以通过点或框等输入提示生成高质量的对象分割区域，实现指定目标的分割。更多相关的介绍可以参考一键分割图像。
图像修补模型LaMa，则能够在高分辨率图像的情况下，随意删除图像中的各种元素。模型的主要架构如下图所示。包含一个mask的黑白图，一张原始图像。将掩码图覆盖图像后输入Inpainting网络中，先是降采样到低分辨率，再经过几个快速傅里叶卷积FFC残差块，最后输出上采样，生成了一张高分辨的修复图像。

AIGC模型Stable Diffusion，则只要简单的输入一段文本，Stable Diffusion 就可以迅速将其转换为图像。更多相关的介绍可以参考AI作画。

将三个模型结合到一起，我们可以做出很多的功能。本文就实现了在图片/视频中移除一切物体、在图片中填充一切物体和在图片中替换一切背景这三种功能，其具体实现步骤如下：

移除一切物体

填充一切物体

替换一切背景

第 1 步：用户点击想要移除的物体；

第 2 步：SAM 将该物体分割出来；

第 3 步：图像修补模型（LaMa）填补该物体。

第 1 步：用户点击想要移除的物体；

第 2 步：SAM 将该物体分割出来；

第 3 步：用户通过文本示意想要填充的内容；

第 4 步：基于文本提示的图像修补模型（Stable Diffusion）根据用户提供的文本对物体进行填充。

第 1 步：用户点击想要保留的物体；

第 2 步：SAM 将该物体分割出来；

第 3 步：用户通过文本示意想要替换的背景；

第 4 步：基于文本提示的图像修补模型（Stable Diffusion）根据用户提供的文本对物体的背景进行替换。

以下为具体通过ModelArts实现Inpaint Anything的流程。

Inpaint Anything适配ModelArts

使用方法：

🔹 本案例需使用 Pytorch-1.8 GPU-P100 及以上规格运行

🔹 点击Run in ModelArts，将会进入到ModelArts CodeLab中，这时需要你登录华为云账号，如果没有账号，则需要注册一个，且要进行实名认证，参考《ModelArts准备工作_简易版》即可完成账号注册和实名认证。登录之后，等待片刻，即可进入到CodeLab的运行环境

🔹 出现 Out Of Memory ，请检查是否为您的参数配置过高导致，修改参数配置，重启kernel或更换更高规格资源进行规避❗❗❗

下面让我们从零开始，一起来体验Inpaint Anything绘制一切的乐趣吧！

1.环境准备

拷贝代码，并安装依赖库

import os
import torch
import os.path as osp
import moxing as mox
path = osp.join(os.getcwd(),'Inpaint-Anything')
if not os.path.exists(path):
    mox.file.copy_parallel('obs://modelarts-labs-bj4-v2/case_zoo/Inpaint-Anything', path)
    if os.path.exists(path):
        print('Download success')
    else:
        raise Exception('Download Failed')
else:
    print("Model Package already exists!")

2.在图片中移除指定对象

!python remove_anything.py \
    --input_img ./example/remove-anything/dog.jpg \
    --coords_type key_in \
    --point_coords 200 450 \
    --point_labels 1 \
    --dilate_kernel_size 15 \
    --output_dir ./results \
    --sam_model_type "vit_h" \
    --sam_ckpt ./pretrained_models/sam_vit_h_4b8939.pth \
    --lama_config ./lama/configs/prediction/default.yaml \
    --lama_ckpt ./pretrained_models/big-lama

import cv2
import matplotlib.pyplot as plt
def show_original_image(image_path, modify_image_path):
    image = cv2.imread(image_path)
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    with_point_image = cv2.imread(modify_image_path + 'with_points.png')
    with_point_image = cv2.cvtColor(with_point_image, cv2.COLOR_BGR2RGB)
    fig = plt.figure(figsize=(20, 10))
    ax1 = fig.add_subplot(1, 2, 1)
    plt.title('Original image', fontsize=16)
    ax1.axis('off')
    ax1.imshow(image)
    ax2 = fig.add_subplot(1, 2, 2)
    plt.title('With_Point image', fontsize=16)
    ax2.axis('off')
    ax2.imshow(with_point_image)
    plt.show()
def show_modify_image(modify_image_path, image_class):
    fig = plt.figure(figsize=(20, 15))
    save_path = modify_image_path
    index = 1
    for i in range(0,3):
        for image_item in image_class:
            file_name = image_item + str(i) + '.png'
            file_path = save_path + file_name
            image = cv2.imread(file_path)
            image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)            
            ax = fig.add_subplot(3,3,index)
            ax.xaxis.set_visible(False)
            ax.yaxis.set_visible(False)
            plt.title(image_item + str(i), fontsize=16) 
            ax.imshow(image)
            index = index + 1
    plt.show()

image_path = './example/remove-anything/dog.jpg'
modify_image_path = './results/dog/'
image_class = ['with_mask_','mask_','inpainted_with_mask_']
show_original_image(image_path, modify_image_path)
show_modify_image(modify_image_path,image_class)

3.在图片中填充指定对象

!python fill_anything.py \
    --input_img ./example/fill-anything/sample1.png \
    --coords_type key_in \
    --point_coords 750 500 \
    --point_labels 1 \
    --text_prompt "a teddy bear on a bench" \
    --dilate_kernel_size 50 \
    --output_dir ./results \
    --sam_model_type "vit_h" \
    --sam_ckpt ./pretrained_models/sam_vit_h_4b8939.pth \
    --model_path "stable-diffusion-2-inpainting"

image_path = './example/fill-anything/sample1.png'
modify_image_path = './results/sample1/'
image_class = ['with_mask_','mask_','filled_with_mask_']
show_original_image(image_path, modify_image_path)
show_modify_image(modify_image_path,image_class)

4.在图片中替换指定对象

!python replace_anything.py \
    --input_img ./example/replace-anything/dog1.png \
    --coords_type key_in \
    --point_coords 750 500 \
    --point_labels 1 \
    --text_prompt "sit on the swing" \
    --output_dir ./results \
    --sam_model_type "vit_h" \
    --sam_ckpt ./pretrained_models/sam_vit_h_4b8939.pth \
    --model_path "stable-diffusion-2-inpainting"

image_path = './example/replace-anything/dog1.png'
modify_image_path = './results/dog1/'
image_class = ['with_mask_','mask_','replaced_with_mask_']
show_original_image(image_path, modify_image_path)
show_modify_image(modify_image_path,image_class)

5.在视频中移除指定对象

!python remove_anything_video.py \
    --input_video ./example/video/paragliding/original_video.mp4 \
    --coords_type key_in \
    --point_coords 652 162 \
    --point_labels 1 \
    --dilate_kernel_size 15 \
    --output_dir ./results \
    --sam_model_type "vit_h" \
    --sam_ckpt ./pretrained_models/sam_vit_h_4b8939.pth \
    --lama_config lama/configs/prediction/default.yaml \
    --lama_ckpt ./pretrained_models/big-lama \
    --tracker_ckpt vitb_384_mae_ce_32x4_ep300 \
    --vi_ckpt ./pretrained_models/sttn.pth \
    --mask_idx 2 \
    --fps 25

from ipywidgets import Output, GridspecLayout
from IPython import display
filepaths = ["./example/video/paragliding/original_video.mp4","./results/w_mask_15.mp4",
             "./results/removed_w_mask_15.mp4"]
grid = GridspecLayout(1,len(filepaths))
for i, filepath in enumerate(filepaths):
    out = Output()
    with out:
        display.display(display.Video(filepath, embed=True,width=250,height=140))
    grid[0, i] = out
grid

运行完成后，从左到右依次为原始视频，选中（去除）对象的视频，去除后的视频。

6.Gradio展示（当前先展示在图像和视频中删除指定对象）

为了方便大家使用一键分割案例，当前增加了Gradio可视化部署案例演示。

示例效果如下：

图片去除
图片填充
背景替换
视频去除

详细实现代码参见Notebook-绘制一切，欢迎各位查看。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

绘制一切

绘制一切-Inpaint Anything

Inpaint Anything

Inpaint Anything工作原理

Inpaint Anything适配ModelArts

1.环境准备

2.在图片中移除指定对象

3.在图片中填充指定对象

4.在图片中替换指定对象

5.在视频中移除指定对象

6.Gradio展示（当前先展示在图像和视频中删除指定对象）

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

绘制一切

绘制一切-Inpaint Anything

Inpaint Anything

Inpaint Anything工作原理

Inpaint Anything适配ModelArts

1.环境准备

2.在图片中移除指定对象

3.在图片中填充指定对象

4.在图片中替换指定对象

5.在视频中移除指定对象

6.Gradio展示（当前先展示在图像和视频中删除指定对象）

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品