标签: 文本转视频

  • OpenAI Sora 文本转视频模型需求

    机构:部署 Sora 需要72万片英伟达加速卡 价值216亿美元

    3月27日消息,市场调查机构 Factorial Funds 近日发布报告,认为 OpenAI 部署文本转视频模型 Sora,在峰值期需要72万片英伟达 H100 AI 加速卡。 如果按照每片英伟达 H100 AI 加速卡3万美元成本计算,72万片需要216亿美元。而这仅仅只是 H100 加速卡的成本。 Factorial Funds 预估训练 Sora 1个月,需要使用4200到10500片英伟达 H100 AI 加速卡,如果使用单片 H100 加速卡,生成1分钟视频需要渲染12分钟。

    —— 科创板日报、Factorial Funds

  • OpenAI 将推出新文本转视频生成器Sora

    OpenAI 的 Sora 将于今年晚些时候公开发布

    OpenAI 首席技术官 Mira Murati 在接受采访时表示,Sora 文本转视频生成器将于“今年”面向公众推出,“可能需要几个月”。OpenAI 还计划“最终”整合音频,这有可能使场景更加真实。 该公司还希望允许用户编辑 Sora 制作的视频中的内容,因为人工智能工具并不总是能创建准确的图像。

    Murati 还提到 Sora 的运行成本比其他模型“昂贵得多”, OpenAI 希望在最终发布时可以让成本降到 DALL-E 的水平。在被问到训练数据时,Murati 表示,她不确定它是否使用了 YouTube、Facebook 和 Instagram 上的视频。

    —— TheVerge

  • 阿里巴巴发布开源文本转视频AI

    阿里巴巴达摩院发布开源文本转视频AI

    该模型基于多阶段文本到视频生成扩散模型,输入描述文本,返回符合文本描述的视频,支持英文输入。

    整体模型参数约17亿,模型需要硬件配置大约是 16GB 内存和 16GB GPU显存。可在 Hugging Face 或 Model Scope 试用。

    项目地址