微闻

标签: 技术发布

  • 智元机器人发布首个通用具身基座大模型

    智元机器人发布首个通用具身基座大模型

    3月10日,智元正式发布首个通用具身基座模型智元启元大模型 (Genie Operator-1)。该模型提出了 Vision-Language-Latent-Action (ViLLA) 架构,该架构由 VLM (多模态大模型) + MoE (混合专家) 组成,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。GO-1通过学习人类视频,助力机器人本体完成递送水杯、制作餐点、迎接外宾等一系列任务。据介绍,GO-1将加速具身智能的普及,机器人将从依赖特定任务的工具,向着具备通用智能的自主体发展,在商业、工业、家庭等多领域发挥更大的作用。

    ——智元机器人

  • 谷歌发布大型语言模型 Gemini 1.0

    谷歌推出最新的大型语言模型 Gemini 1.0

    谷歌发布最新的大型语言模型 Gemini,谷歌 CEO 皮查伊在 6 月份的 I/O 开发者大会上首次透露了该模型,现在正式向公众推出。

    谷歌针对不同场景发布了三种不同尺寸的版本。例如 Google 的人工智能聊天机器人 Bard 现在由可扩展的 Gemini Pro 提供支持。

    Gemini Nano 是轻量版本,旨在 Android 设备上本地离线运行,Pixel 8 Pro 成为首款搭载此模型的设备。

    Gemini Ultra,它是谷歌迄今为止创建的最强大的 LLM,适用于高度复杂的任务。似乎主要是为数据中心和企业应用设计的。

    —— 谷歌博客

  • Google IO将公布PaLM 2大模型

    Google IO 将公布 PaLM 2 大模型

    Google 将在年度开发者大会 Google I/O 上宣布它的新版通用大语言模型 PaLM 2。

    PaLM 是 Google 在 2022 年 4 月宣布的大模型,有 5400 亿参数,Google AI 和 DeepMind 后在此基础上开发了一个用医学数据集微调的版本 Med-PaLM,它是首个在美国医师资格考试中获得及格分的 AI 模型。

    在 5 月 10 日周三举行的开发者大会上 Google 宣布的 PaLM 2 将是该公司最先进的大模型,其内部代号为“Unified Language Model(统一语言模型)”,包含逾百种语言,能执行范围广泛编程和数学测试,以及创意写作测试和分析。

    —— CNBC