智元机器人发布首个通用具身基座大模型
3月10日,智元正式发布首个通用具身基座模型智元启元大模型 (Genie Operator-1)。该模型提出了 Vision-Language-Latent-Action (ViLLA) 架构,该架构由 VLM (多模态大模型) + MoE (混合专家) 组成,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。GO-1通过学习人类视频,助力机器人本体完成递送水杯、制作餐点、迎接外宾等一系列任务。据介绍,GO-1将加速具身智能的普及,机器人将从依赖特定任务的工具,向着具备通用智能的自主体发展,在商业、工业、家庭等多领域发挥更大的作用。
——智元机器人
发表回复