AI视频生成工作流介绍

举报
AI在路上 发表于 2025/08/08 21:13:45 2025/08/08
【摘要】 输入文字描述或者文字+图片,AI视频生成可以实时生成高质量短视频,并支持多种风格,零门槛打造专属视觉内容,让创意快速落地。

功能简介

使用场景

输入文字描述,AI视频生成可以实时生成高质量短视频,并支持多种风格,零门槛打造专属视觉内容,让创意快速落地。该agent主要包含以下两部分核心能力:

1)图生视频(Image-to-Video):将静态图像扩展为动态视频序列,通常通过预测图像中的运动模式或补充时间维度信息实现。图生视频能力采用了华为MAAS平台提供的开源模能力Wan2.1-I2V-14B-480PWan2.1-I2V-14B-720P

2)文生视频(Text-to-Video):直接将文本描述转化为视频内容,是文生图技术的时序扩展,需同时处理空间与时间维度信息。文生视频能力采用华为MAAS平台提供的开源模能力Wan2.1-T2V-14B

搭建工作流

工作流中变量介绍:

工作流页面展示如图1:


图片1.png

1:工作流首页面

系统在整个对话生命周期内会维护一组用户变量和会话变量,其中用户变量用于界面定义和采集用户输入,会话变量用于保存状态信息、传递上下文、避免重复工作并最终生成完整报告。用户变量和会话变量定义如图2

图片2.png

2:用户变量与会话变量定义

详情见如下表格:

用户变量

描述

功能介绍

会话变量

描述

功能介绍

picture

图片输入

在图生视频工作流时,用户可以本地上传图片,也可以使用网络图片的URL作为图生视频的图像源

video_fp

视频帧率

用于在会话中存储和传递输入的视频帧率数值。并方便在工作流中进行逻辑判断和赋值,并最终传递给模型。

generate_type

工作流功能选择

用户可以选择:文生视频、图生视频

vide_time

视频时长

用于在会话中存储和传递输入的视频时长数值。并方便在工作流中进行逻辑判断和赋值,并传给模型。

video_resolution

视频分辨率

在文生视频和图生视频能力中,用户可以选择生成的视频分辨率

video_px

视频分辨率

用于在会话中存储和传递视频分辨率数值。并方便在工作流中进行逻辑判断和赋值,并传给模型。

fps帧率

视频帧率

在文生视频和图生视频能力中,用户可以选择生成的视频的帧率

seed_result

随机种子

用于在会话中存储和传递随机种子数值。并方便在工作流中进行逻辑判断和赋值,并传给模型。

duration

视频时长

在文生视频和图生视频能力中,用户可以选择生成的视频的时长

 

 

 

seed

随机种子

在文生视频、图生视频、文生图像,随机种子,用于控制生成内容的随机性

/

/

/

 

 

 

/

/

/

 

工作流核心能力编排介绍:

1)用户变量与会话变量逻辑判断和赋值:将用户变量赋值给会话变量,并进行逻辑判空和默认值赋值,可以增强用户体验,用户可以不做任何数值输入便可以调用工作流完成内容创作,见图3

图片3.png

图片3-4.png


3.用户变量与会话变量处理

2)检查生成方式,工作流会根据用户输入的文生视频、图生视频,来选择进入不同的工作流分支进行工作,见图4.

图片4.png

4.检查生成方式

3)文生视频,该分支主要流程包括使用大语言模型对用户输入的提示词进行改写,然后调用Wan2.1-T2V-14B模型进行内容生成。提示词改写和内容生成均采用了maas平台上的deepseek-v3Wan2.1-T2V-14B模型,注意Wan2.1-T2V-14B模型需要在maas上开白后才能使用。使用指导见以下链接:https://support.huaweicloud.com/usermanual-maas-modelarts/maas-modelarts-1186.html文生视频提示词改写见图5,由于maas上创建视频是异步的,所以有两步任务,首先创建视频生成任务并返回taskId,再拿taskIdmaas上查任务结果,创建和查询视频生成任务需要MaaS API Key,在环境变量添加即可,整个流程见图678910、11

图片6.png


5.文生视频提示词改写

图片5.png


6.添加MaaS API Key

图片7.png


图7.创建文生视频任务

图片8.png


8.解析taskId

图片9.png


9.循环检查创建视频任务是否结束

图片10.png


图10.查询文生视频结果

图片11.png


11.解析返回结果并返回

4)图生视频,该分支主要流程包括图片内容转base64,图生视频分辨率选择,生成视频内容。该模块主要使用maas平台Wan2.1-I2V-14B-480PWan2.1-I2V-14B-720P,注意这两个模型需要开白后才能使用,使用指导见以下链接:https://support.huaweicloud.com/usermanual-maas-modelarts/maas-modelarts-1186.html由于maas平台图片视频接口,有两种规格480p720p所以根据分辨率进行区分,如图12. 后续工作流和图7891011类似,不再赘述。

图片12.png

12.图生视频分支选择

调试预览

dify帮助文档

 

在编排工作流时,点击右上方工具栏中的预览按钮可基于当前编排的工作流进行调试。

 

应用发布

dify帮助文档

 

需要发布应用时,依次点击右上方工具栏中的发布、发布更新按钮,然后点击运行可查看发布后的应用。

应用监控

dify帮助文档

 

在工作流编排页面,点击监控按钮可查看工作流运行状况

点击左侧工具栏日志与标注,可查看工作流历史运行记录

 

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。