AI视频生成工作流介绍
功能简介
使用场景
输入文字描述,AI视频生成可以实时生成高质量短视频,并支持多种风格,零门槛打造专属视觉内容,让创意快速落地。该agent主要包含以下两部分核心能力:
1)图生视频(Image-to-Video):将静态图像扩展为动态视频序列,通常通过预测图像中的运动模式或补充时间维度信息实现。图生视频能力采用了华为MAAS平台提供的开源模能力Wan2.1-I2V-14B-480P和Wan2.1-I2V-14B-720P。
2)文生视频(Text-to-Video):直接将文本描述转化为视频内容,是文生图技术的时序扩展,需同时处理空间与时间维度信息。文生视频能力采用华为MAAS平台提供的开源模能力Wan2.1-T2V-14B。
搭建工作流
工作流中变量介绍:
工作流页面展示如图1:
图1:工作流首页面
系统在整个对话生命周期内会维护一组用户变量和会话变量,其中用户变量用于界面定义和采集用户输入,会话变量用于保存状态信息、传递上下文、避免重复工作并最终生成完整报告。用户变量和会话变量定义如图2:
图2:用户变量与会话变量定义
详情见如下表格:
用户变量 |
描述 |
功能介绍 |
会话变量 |
描述 |
功能介绍 |
picture |
图片输入 |
在图生视频工作流时,用户可以本地上传图片,也可以使用网络图片的URL作为图生视频的图像源 |
video_fp |
视频帧率 |
用于在会话中存储和传递输入的视频帧率数值。并方便在工作流中进行逻辑判断和赋值,并最终传递给模型。 |
generate_type |
工作流功能选择 |
用户可以选择:文生视频、图生视频 |
vide_time |
视频时长 |
用于在会话中存储和传递输入的视频时长数值。并方便在工作流中进行逻辑判断和赋值,并传给模型。 |
video_resolution |
视频分辨率 |
在文生视频和图生视频能力中,用户可以选择生成的视频分辨率 |
video_px |
视频分辨率 |
用于在会话中存储和传递视频分辨率数值。并方便在工作流中进行逻辑判断和赋值,并传给模型。 |
fps帧率 |
视频帧率 |
在文生视频和图生视频能力中,用户可以选择生成的视频的帧率 |
seed_result |
随机种子 |
用于在会话中存储和传递随机种子数值。并方便在工作流中进行逻辑判断和赋值,并传给模型。 |
duration |
视频时长 |
在文生视频和图生视频能力中,用户可以选择生成的视频的时长 |
|
|
|
seed |
随机种子 |
在文生视频、图生视频、文生图像,随机种子,用于控制生成内容的随机性 |
/ |
/ |
/ |
|
|
|
/ |
/ |
/ |
工作流核心能力编排介绍:
1)用户变量与会话变量逻辑判断和赋值:将用户变量赋值给会话变量,并进行逻辑判空和默认值赋值,可以增强用户体验,用户可以不做任何数值输入便可以调用工作流完成内容创作,见图3。
图3.用户变量与会话变量处理
2)检查生成方式,工作流会根据用户输入的文生视频、图生视频,来选择进入不同的工作流分支进行工作,见图4.
图4.检查生成方式
3)文生视频,该分支主要流程包括使用大语言模型对用户输入的提示词进行改写,然后调用Wan2.1-T2V-14B模型进行内容生成。提示词改写和内容生成均采用了maas平台上的deepseek-v3和Wan2.1-T2V-14B模型,注意Wan2.1-T2V-14B模型需要在maas上开白后才能使用。使用指导见以下链接:https://support.huaweicloud.com/usermanual-maas-modelarts/maas-modelarts-1186.html文生视频提示词改写见图5,由于maas上创建视频是异步的,所以有两步任务,首先创建视频生成任务并返回taskId,再拿taskId去maas上查任务结果,创建和查询视频生成任务需要MaaS API Key,在环境变量添加即可,整个流程见图6、7、8、9、10、11。
图5.文生视频提示词改写
图6.添加MaaS API Key
图7.创建文生视频任务
图8.解析taskId
图9.循环检查创建视频任务是否结束
图10.查询文生视频结果
图11.解析返回结果并返回
4)图生视频,该分支主要流程包括图片内容转base64,图生视频分辨率选择,生成视频内容。该模块主要使用maas平台Wan2.1-I2V-14B-480P、Wan2.1-I2V-14B-720P,注意这两个模型需要开白后才能使用,使用指导见以下链接:https://support.huaweicloud.com/usermanual-maas-modelarts/maas-modelarts-1186.html由于maas平台图片视频接口,有两种规格480p和720p所以根据分辨率进行区分,如图12. 后续工作流和图7、8、9、10、11类似,不再赘述。
图12.图生视频分支选择
调试预览
在编排工作流时,点击右上方工具栏中的预览按钮可基于当前编排的工作流进行调试。
应用发布
需要发布应用时,依次点击右上方工具栏中的发布、发布更新按钮,然后点击运行可查看发布后的应用。
应用监控
在工作流编排页面,点击监控按钮可查看工作流运行状况
点击左侧工具栏日志与标注,可查看工作流历史运行记录
- 点赞
- 收藏
- 关注作者
评论(0)