通过阿里云GPU服务器生成AI视频(AIGC文本生成视频)

通过阿里云GPU服务器生成AI视频,即AIGC文本生成视频,本文阿腾云atengyun.com整理使用阿里云GPU服务器搭建Stable Diffusion模型,并基于ModelScope框架,实现使用文本生成视频,可以在阿里云CLUB中心查看 aliyun.club 当前最新的GPU服务器优惠券和报价单。

自多态模型GPT-4发布后,AIGC(AI Generated Content,AI生成内容)时代正扑面而来,从单一的文字文本,演化到更丰富的图片、视频、音频、3D模型等。本文基于阿里云GPU服务器和文本生成视频模型,采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现文本生成视频功能。

AIGC文本生成视频

大致流程为:先创建一台阿里云GPU服务器ecs.gn7i-c16g1.4xlarge实例,然后选择云镜像市场中的ai-inference-solution,该镜像内置了Stable Diffusion、太乙-中文模型和太乙-动漫风格模型以及模型运行环境。详细镜像介绍参考:阿里云解决AIGC/LLM方案镜像ai-inference-solution内置模型

创建一台阿里云GPU服务器

1、打开阿里云GPU服务器页面 https://t.aliyun.com/U/sRJ4bd 如下图:

阿里云GPU服务器ecs.gn7i-c16g1.4xlarge
阿里云GPU服务器ecs.gn7i-c16g1.4xlarge

阿腾云选择了一台GPU计算型gn7i云服务器,实例规格为ecs.gn7i-c16g1.4xlarge,NVIDIA A10 GPU卡,24 GB显存。价格方面,可以在阿里云CLUB中心查看 aliyun.club 当前最新的GPU服务器优惠券和报价单。

选择ai-inference-solution镜像

在镜像中选择“云市场镜像”,点击“从云市场获取更多选择(含操作系统)”,如下图:

云市场镜像
云市场镜像

然后搜索“ai-inference-solution”,点右侧的“使用”,如下图:

使用ai-inference-solution云市场镜像
使用ai-inference-solution云市场镜像

该镜像是免费使用的。该镜像能够解决解决stable-diffusion模型推理加速方案、chatglm-6b构建AI对话方案、Text-to-video-synthesis文本生成视频方案和文本生成3D模型方案 (HRN人脸重建)。

关于GPU服务器的公网IP配置选择,可以选择按使用流量计费,这是一种后付费模式,根据流量使用多少来收费,一般中国大陆地域是0.8元每GB,带宽峰值可设置100Mbps。更多其他的云服务器配置,阿腾云不多赘述,然后点击确认下单即可。

大约等待2、3分钟,阿里云系统会自动创建一台集成了三大模型和模型运行环境的GPU服务器。

创建成功后,就是远程连接到GPU服务器然后开始文本生成视频流程。不会远程连接的同学,参考教程:https://t.aliyun.com/U/STzZkL

文本生成视频

1、执行如下命令,切换conda环境到modelscope中

conda activate modelscope

2、执行如下命令,切换到scripts目录

cd /root/scripts

3、执行如下脚本,生成视频。

./text2video.py

说明:首次执行脚本时,会通过公网自动下载所需模型库,100 Mbps带宽下载时间大约为20分钟。生成的text2video.mp4视频文件存放在/root/scripts/output目录中。

本文使用阿里云GPU服务器的AIGC文本生成视频教程,参考阿里云,实际请以阿里云官网为准 atengyun.com/go/aliyun

腾讯云服务器特价:https://curl.qcloud.com/oRMoSucP

阿里云服务器优惠:https://t.aliyun.com/U/bLynLC