智元机器人发布首个通用具身基座大模型

智元机器人发布首个通用具身基座大模型

3月10日,智元正式发布首个通用具身基座模型智元启元大模型 (Genie Operator-1)。该模型提出了 Vision-Language-Latent-Action (ViLLA) 架构,该架构由 VLM (多模态大模型) + MoE (混合专家) 组成,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。GO-1通过学习人类视频,助力机器人本体完成递送水杯、制作餐点、迎接外宾等一系列任务。据介绍,GO-1将加速具身智能的普及,机器人将从依赖特定任务的工具,向着具备通用智能的自主体发展,在商业、工业、家庭等多领域发挥更大的作用。

——智元机器人

更多文章

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注