谷歌推出 Gemini 2.0 模型带来智能体能力
谷歌推出其旗舰人工智能模型新版本,据称该模型的速度比之前版本快两倍,并将为协助用户的虚拟代理提供动力。谷歌公司周三表示,新模型 Gemini 2.0 可以跨语言生成图像和音频,并可在谷歌搜索和编码项目中提供帮助。Gemini 新功能使构建能够思考、记忆、规划甚至代表用户采取行动的代理成为可能。谷歌公司本周将开始在搜索和 AI 摘要中测试 Gemini 2.0。谷歌周三还向开发人员提供了 Gemini 2.0 Flash 的实验版本,这是其快速高效的人工智能模型,该模型可以更好地处理图像并接近人类的推理能力。
另外三个实验性项目也将由 Gemini 2.0 驱动。I/O 大会上宣布的现实世界理解项目 Astra 已经完成了 Android 版本的测试,即将开始眼镜版本的原型测试。Mariner 项目旨在从浏览器开始探索人机交互的未来,它能够理解和推理浏览器屏幕上的信息,然后通过实验性的 Chrome 扩展程序代替用户完成复杂任务。编码智能体 Jules 可直接集成到 GitHub 工作流中,以在开发人员监督下自主解决问题、制定计划并执行。
—— Google 博客、彭博社