agent-以图搜图工作流介绍
【摘要】 “以图搜图”是利用多模态模型提取图片语义信息,快速从数据库中检索相似图片。适用于需要对比图片相似度,并给出结果的企业,如设计工作室、或企业设计师、餐饮行业菜品识别等场景,协助更好更快的给出图片结果。
功能介绍
使用场景
“以图搜图”是利用多模态模型提取图片语义信息,快速从数据库中检索相似图片。适用于需要对比图片相似度,并给出结果的企业,如设计工作室、或企业设计师、餐饮行业菜品识别等场景,协助更好更快的给出图片结果。
主要包含两个工作流:
图搜图入库:获取图片并写入库,配合【以图搜图】智能体使用。
以图搜图:利用多模态模型提取图片语义信息,快速从数据库中检索相似图片。
搭建工作流
前提:已经部署Flexus AI 智能体且正常访问登录dify平台。
图搜图入库
搭建流程
- 将工作流添加至工作区。

- 获取API密钥:单击知识库-API-API密钥,在API密钥弹窗单击创建密钥;

- 获取API 服务器地址:在知识库-API界面,右上角复制API服务器地址;

- 创建文档节点 API key授权配置,其中API 服务器地址和API 密钥参考步骤3、步骤4获取并填入。
- 创建空知识库(图片经模型处理后的保存位置):①单击知识库,创建知识库,创建一个空知识库;②知识库创建成功之后,在浏览器地址栏复制该知识库对应的数据集ID;



- API Key授权成功之后,在该节点更新数据集ID(创建知识库的知识库ID,获取参考步骤5);

- 发布:依次点击右上方工具栏中的“发布”、“发布更新”按钮,然后点击“运行”可查看发布后的应用。

工作流介绍
- 入参变量:图片URL,确保是公网可访问的地址,dify工作流会请求下载图片;
- 图片理解(Qwen2.5-VL-72B):解析下载的图片并生成文本描述,随后将其存储至知识库。

以图搜图工作流配置:
搭建流程
- 将工作流添加至工作区。

- 知识检索节点配置:依次点击知识检索节点、添加图搜图图库节点创建的知识库并点击添加。

工作流介绍:
-
输入:支持通过图像URL或本地上传的方式,提交待搜索的图片。
-
处理:使用 Qwen2.5-VL-72B 模型解析图片内容,并在指定知识库中进行检索。
-
输出:返回相似的图片及其相似度得分。该得分为0到1之间的数值,值越高代表越相似。

调试预览
在编排工作流时,点击右上方工具栏中的 “运行”按钮可基于当前编排的工作流进行调试。

应用发布
需要发布应用时,依次点击右上方工具栏中的“发布”、“发布更新”按钮,然后点击“运行”可查看发布后的应用。
测试图片:https://flexus-agent.obs.cn-east-3.myhuaweicloud.com/flexus_assets/demo_file/pic1.jpg

应用监控
在工作流编排页面,点击监控按钮可查看工作流运行状况
点击左侧工具栏日志与标注,可查看工作流历史运行记录
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者










评论(0)