- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

如何使用LLM实现文本自动生成视频

yd_217961358 发表于 2023/08/21 18:00:58 2023/08/21

【摘要】让文字栩栩如生：使用 Python 从文本生成令人惊叹的视频的简单技术。

让文字栩栩如生：使用 Python 从文本生成令人惊叹的视频的简单技术。

推荐：使用NSDT场景编辑器助你快速搭建可二次编辑的3D应用场景

介绍

基于扩散的图像生成模型代表了计算机视觉领域的革命性突破。这些进步由Imagen，DallE和MidJourney等模型开创，展示了文本条件图像生成的卓越功能。有关这些模型内部工作的介绍，您可以阅读本文。

然而，Text-2-Video模型的开发提出了更艰巨的挑战。目标是在每个生成的帧之间实现连贯性和一致性，并保持从视频开始到结束的生成上下文。

然而，基于扩散的模型的最新进展也为文本2视频任务提供了广阔的前景。现在，大多数文本 2-视频模型在预先训练的文本 2-图像模型上采用微调技术，集成动态图像运动模块，并利用各种文本 2-视频数据集，如 WebVid 或 HowTo100M。

在本文中，我们的方法涉及利用HuggingFace提供的微调模型，该模型被证明有助于生成视频。

实现

先决条件

我们使用HuggingFace提供的Diffusers库，以及一个名为Accelerate的实用程序库，它允许PyTorch代码在并行线程中运行。这加快了我们的生成过程。

首先，我们必须安装依赖项并为代码导入相关模块。

pip install diffusers transformers accelerate torch

然后，从每个库中导入相关模块。

import torch
from diffusers import DiffusionPipeline, DPMSolverMultistepScheduler
from diffusers.utils import export_to_video

创建管道

我们将ModelScope提供的Text-2-Video模型加载到HuggingFace中，在扩散管道中。该模型具有 1 亿个参数，基于 UNet7D 架构，该架构通过迭代去噪过程从纯噪声生成视频。它分为三部分。模型首先从简单的英语提示符中执行文本特征提取。然后将文本特征编码到视频潜在空间并进行去噪。最后，将视频潜在空间解码回视觉空间并生成短视频。

pipe = DiffusionPipeline.from_pretrained(
"damo-vilab/text-to-video-ms-1.7b", torch_dtype=torch.float16, variant="fp16")


pipe.scheduler = DPMSolverMultistepScheduler.from_config(
pipe.scheduler.config)


pipe.enable_model_cpu_offload()

此外，我们使用 16 位浮点精度来降低 GPU 利用率。此外，还启用了 CPU 卸载，可在运行时从 GPU 中删除不必要的部分。

生成视频

prompt = "Spiderman is surfing"
video_frames = pipe(prompt, num_inference_steps=25).frames
video_path = export_to_video(video_frames)

然后，我们将提示传递给视频生成管道，该管道提供一系列生成的帧。我们使用 25 个推理步骤，以便模型将执行 25 次去噪迭代。更多的推理步骤可以提高视频质量，但需要更多的计算资源和时间。

然后使用扩散器的实用程序功能组合单独的图像帧，并将视频保存在磁盘上。

然后，我们将提示传递给视频生成管道，该管道提供一系列生成的帧。然后使用扩散器的实用程序功能组合单独的图像帧，并将视频保存在磁盘上。

结论

足够简单！我们得到了蜘蛛侠冲浪的视频。虽然这是一个质量不高的短视频，但它仍然象征着这个过程的前景，它很快就会达到与Image-2-Text模型类似的结果。尽管如此，测试你的创造力和使用模型仍然足够好。

原文链接：如何使用LLM实现文本自动生成视频 (mvrlink.com)

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

如何使用LLM实现文本自动生成视频

介绍

实现

先决条件

创建管道

生成视频

结论

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

如何使用LLM实现文本自动生成视频

介绍

实现

先决条件

创建管道

生成视频

结论

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品