Skip to main content

阿里巴巴达摩院发布开源文本转视频AI该模型基于多阶段文本到视频生成扩散模型,输入描述文本,返回符合文本描述的视频,支持英文输入

  1. 阿里巴巴达摩院发布开源文本转视频AI

    该模型基于多阶段文本到视频生成扩散模型,输入描述文本,返回符合文本描述的视频,支持英文输入。

    整体模型参数约17亿,模型需要硬件配置大约是 16GB 内存和 16GB GPU显存。可在 Hugging FaceModel Scope 试用。

    项目地址