标签：技术发布

智元机器人发布首个通用具身基座大模型

智元机器人发布首个通用具身基座大模型

3月10日，智元正式发布首个通用具身基座模型智元启元大模型 (Genie Operator-1)。该模型提出了 Vision-Language-Latent-Action (ViLLA) 架构，该架构由 VLM (多模态大模型) + MoE (混合专家) 组成，实现了可以利用人类视频学习，完成小样本快速泛化，降低了具身智能门槛，并成功部署到智元多款机器人本体。GO-1通过学习人类视频，助力机器人本体完成递送水杯、制作餐点、迎接外宾等一系列任务。据介绍，GO-1将加速具身智能的普及，机器人将从依赖特定任务的工具，向着具备通用智能的自主体发展，在商业、工业、家庭等多领域发挥更大的作用。

——智元机器人

2025年3月10日
谷歌发布大型语言模型 Gemini 1.0

谷歌推出最新的大型语言模型 Gemini 1.0

谷歌发布最新的大型语言模型 Gemini，谷歌 CEO 皮查伊在 6 月份的 I/O 开发者大会上首次透露了该模型，现在正式向公众推出。

谷歌针对不同场景发布了三种不同尺寸的版本。例如 Google 的人工智能聊天机器人 Bard 现在由可扩展的 Gemini Pro 提供支持。

Gemini Nano 是轻量版本，旨在 Android 设备上本地离线运行，Pixel 8 Pro 成为首款搭载此模型的设备。

Gemini Ultra，它是谷歌迄今为止创建的最强大的 LLM，适用于高度复杂的任务。似乎主要是为数据中心和企业应用设计的。

—— 谷歌博客

2024年12月5日
Google IO将公布PaLM 2大模型

Google IO 将公布 PaLM 2 大模型

Google 将在年度开发者大会 Google I/O 上宣布它的新版通用大语言模型 PaLM 2。

PaLM 是 Google 在 2022 年 4 月宣布的大模型，有 5400 亿参数，Google AI 和 DeepMind 后在此基础上开发了一个用医学数据集微调的版本 Med-PaLM，它是首个在美国医师资格考试中获得及格分的 AI 模型。

在 5 月 10 日周三举行的开发者大会上 Google 宣布的 PaLM 2 将是该公司最先进的大模型，其内部代号为“Unified Language Model（统一语言模型）”，包含逾百种语言，能执行范围广泛编程和数学测试，以及创意写作测试和分析。

—— CNBC

2024年12月5日

标签： 技术发布

智元机器人发布首个通用具身基座大模型

谷歌发布大型语言模型 Gemini 1.0

Google IO将公布PaLM 2大模型

标签：技术发布