阿里巴巴发布开源文本转视频AI

作者：

在

阿里巴巴达摩院发布开源文本转视频AI

该模型基于多阶段文本到视频生成扩散模型，输入描述文本，返回符合文本描述的视频，支持英文输入。

整体模型参数约17亿，模型需要硬件配置大约是 16GB 内存和 16GB GPU显存。可在 Hugging Face 或 Model Scope 试用。

项目地址

开源文本转视频AI 阿里巴巴

更多文章

评论

发表回复取消回复