标签: 万相

  • 阿里万相视频生成大模型开源

    阿里旗下万相视频生成大模型宣布开源

    阿里云旗下视觉生成基座模型万相2.1(Wan)宣布开源,开源采用的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。据介绍,14B万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集VBench中,万相2.1以总分86.22%的成绩超越Sora、Luma、Pika等国内外模型,稳居榜首位置。1.3B版本测试结果不仅超过了更大尺寸的开源模型,甚至还接近部分闭源模型,同时能在消费级显卡运行,仅需8.2GB显存就可以生成高质量视频,适用于二次模型开发和学术研究。

    —— Github、HuggingFace、魔搭社区

  • 阿里巴巴开源视频模型万相2.1

    阿里巴巴将开源旗下文生视频模型万相2.1

    从知情人士处获悉,阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型。今年1月,阿里旗下万相刚宣布推出2.1 版本模型升级,视频生成、图像生成两大能力均获得提升。在视频生成方面,万相 2.1 通过自研的高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能,登上VBench榜单第一。据此前介绍,万相2.1支持中英文视频,可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等。

    —— 新浪科技