人工智能文生图技术介绍

举报
霍格沃兹测试开发 发表于 2024/06/03 11:44:10 2024/06/03
【摘要】 简介传统的绘图方式是由设计师手绘或者通过软件绘制图片,中间需要使用到类似于PS这样的工具。所谓文生图,就是指直接通过一些描述性文字生成对应的图片的技术。以前,完成各种设计,是离不开设计师的参与的。但是通过文生图技术,可以直接将对于图片的需求发送给程序,让程序生成。 文生图实现方式文成图有两种实现方式:类型示例“代码式”文生图PlantUML/Mermaid/Reveal.jsAI文生图Mi...

简介

传统的绘图方式是由设计师手绘或者通过软件绘制图片,中间需要使用到类似于PS这样的工具。所谓文生图,就是指直接通过一些描述性文字生成对应的图片的技术。

以前,完成各种设计,是离不开设计师的参与的。但是通过文生图技术,可以直接将对于图片的需求发送给程序,让程序生成。

image.png

文生图实现方式

文成图有两种实现方式:

类型 示例
“代码式”文生图 PlantUML/Mermaid/Reveal.js
AI文生图 MidJourney、文心一言

代码式文生图

顾名思义,其实就是通过编写符合工具语法规范的代码、或者markdown文本,去生成对应格式的图片。以下是几个代码式文生图的示例。

PLANTUML

PlantUML是一个开源工具,用于通过简单的文本描述来创建各种类型的图形,包括类图、时序图、用例图、组件图、活动图等。

不过它具有一定的学习成本,通常都是开发团队和架构师进行使用。

image.png

MERMAID

Mermaid(美人鱼)是一个用于创建流程图、时序图、甘特图、类图等图形的开源标记语言和JavaScript库。

Mermaid 受到开发人员和文档作者的欢迎,因为它使创建图形变得简单且易于维护。

image.png

REVEAL.JS

Reveal.js 是一个开源的HTML和JavaScript框架,用于创建演示文稿和幻灯片。它允许用户使用HTML、CSS和JavaScript来制作交互式和美观的演示,而不需要依赖于传统的演示软件。

除此之外,还可以使用 Markdown 插件编写PPT。不过Reveal.js同样也是具有一定的学习成本,所以更适合开发者进行学习与使用。

image.png

AI 文生图

MIDJOURNEY

Midjourney是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像[1][2],于2022年7月12日进入公开测试阶段[3],用户可透过Discord的机器人指令进行操作[4]。该研究实验室由Leap Motion的创办人大卫·霍尔兹(David Holz)负责领导[5]。——来自维基百科

image.png

image.png

新版Midjourney,用户使用风格化命令,就能轻而易举地生成大师级作品。Midjourney 由于其良好的体验、惊艳的产品效果,目前还是文生图领域的“领跑者”。

文心一言

文心一言(英语:ERNIE Bot)是由百度公司开发的聊天机器人,能够与人交互、回答问题及协作创作。该产品被传媒称为国际著名聊天机器人ChatGPT的中国版及其竞争对手[1][2]。目前已开放用户申请加入体验,但现仅支持百度帐号绑定中国大陆电话号码的企业级用户和个人用户[3]。——来自维基百科

image.png

文心一言同样也具备文生图功能,不过目前还不够成熟,相信给到一定的时间,一定能发展成为一个优秀的大语言模型产品。

总结

文生图现在的工具以及使用体验逐渐越来越强大,不论是代码式文生图还是AI 文生图,都可以选择适合自己工作场景的工具进行使用。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。