微闻

标签: Gemini

  • 谷歌Gemini将新增视频生成功能

    谷歌 Gemini 助理或将新增视频生成功能

    谷歌一直在为其人工智能数字助理 Gemini 添加功能。我们已经看到了一些功能,这些功能增加了更深层次的上下文,简化了文件处理,甚至可以跨应用链接。近期 Google 移动应用中包含代码显示,谷歌正在开发一项视频生成功能,可能会在未来的更新中添加到 Gemini 中。Google 应用 v16.6.23 包含的代码暗示谷歌将为 Gemini 添加视频生成功能。代码显示,“robin”旁边提到了“videogen”,而“robin”正是谷歌应用中 Gemini 的代号。此功能尚未上线,其发布日期尚不确定。

    —— AndroidAuthority

  • 谷歌 Gemini 免费上传文件分析功能即时可用

    谷歌 Gemini 文件分析正在向用户免费推出

    谷歌 ​Gemini 提供了一项实用功能,只要用户订阅了 Gemini Advanced 服务,就可以通过上传文档或电子表格来获取答案、生成摘要和创建图表。​谷歌正在取消 Gemini 上传和分析功能的订阅要求。​Reddit 论坛上的用户报告显示,即使在 Gemini 的免费版本中现在也可以使用上传选项。​没有订阅的用户将获得固定的每日配额来使用该功能,但没有确切的数字,因为谷歌尚未更新这项功能的支持文档。当使用该功能时,将看到已使用的每日配额百分比。超出限制,将需要等待几个小时才能重置配额。​这项功能似乎正在逐步推出,预计将在未来几天内覆盖所有用户。

    —— Androidauthority

  • 谷歌 Gemini 应用添加新预览模型

    Google Gemini 应用添加了 2.0 Pro 和 2.0 Flash Thinking 预览模型

    谷歌在 2.0 Flash 面向消费者发布后,推出了新的预览模型 2.0 Pro 和 2.0 Flash Thinking ,这些模型将在 Gemini 应用中提供测试。谷歌表示,2.0 Pro Experimental 是其“迄今为止编码性能和复杂提示方面的最佳模型”。它还“比我们迄今为止发布的任何模型都具有更好的理解和推理世界知识的能力”。Gemini Advanced 订阅用户今天开始能够在网页和应用上预览 2.0 Pro Experimental。

    Gemini 2.0 Flash Thinking Experimental 将在 Gemini 应用中向所有用户免费提供测试。谷歌表示,该模型具有 2.0 Flash 的速度和性能,并表示“经过训练,可以将提示分解为一系列步骤,以增强其推理能力并提供更好的响应。” 同时,谷歌还提供了“2.0 Flash Thinking Experimental with apps”,可以推理并“与 YouTube、搜索和谷歌地图等应用交互”。

    —— 9to5google

  • 谷歌更新Gemini语言模型系列

    Google 更新 Gemini 2.0 模型系列

    谷歌周三宣布更新其 Gemini 多模态大型语言模型系列,包括一条新产品线。谷歌周三向正式推出了可用于生产环境的 Gemini 2.0 Flash,还推出了更便宜的 Flash-Lite,并发布了有 200 万个 token 上下文窗口的旗舰“Pro”模型的新版本,现在已经开放免费测试。

    Gemini Flash-Lite 上的输入每 100 万个 token 的费用为 0.019 美元。相比之下,OpenAI 旗舰模型的经济版价格为 0.075 美元,DeepSeek-V3 廉价模型价格为 0.014 美元,不过 DeepSeek 在其网站上表示,价格将于 2 月 8 日上涨五倍。

    —— 谷歌博客,路透社

  • 谷歌Gemini应用升级Flash 2.0版本

    ​谷歌Gemini AI应用借助Flash 2.0变得更快

    ​谷歌周四宣布,Gemini 应用将获得 Gemini 2.0 Flash AI 模型。谷歌公司在一篇帖子中表示,升级后的模型“在多项关键基准测试中提供快速响应和更强的性能,为头脑风暴、学习或写作等日常任务提供帮助” 。这项变更正在 Gemini 的网页和移动应用中推出,并将向所有用户开放。谷歌还表示,用户在“接下来的几周内”仍然可以使用 Gemini 1.5 Flash 和 1.5 Pro。谷歌还表示,Gemini 的图像生成功能现在使用该公司最新版本的 Imagen 3 AI 文本转图像生成器。该模型“提供更丰富的细节和纹理”并且“更准确地遵循您的指令”。

    —— TheVerge

  • 谷歌 Gemini 新增功能:记忆保存用户兴趣和喜好

    谷歌 Gemini 现可记住用户的兴趣和喜好

    ​谷歌人工智能聊天助手 Gemini 现在可以记住用户在工作、爱好、人生总体目标等方方面面的兴趣和喜好。这有助于 Gemini 根据用户的需求准确提供更实用、更相关的回答。你可以想象成给 Gemini 提供一份由你设计的用户手册。用户可以通过自然对话或专用的“已保存的信息”页面,与 Gemini 分享信息以及管理通过 Gemini 保存的信息。该服务目前仅通过 Gemini Advanced 订阅提供,并且仅支持英语。谷歌表示,通过保存与你的生活和工作相关的信息,你可以让 Gemini 更加符合自己的需求,大幅提升效率和创造力。无需重复提供相同的细节信息,就能获得更加一致且可预测的回答。

    —— 谷歌

  • 谷歌修复Gemini人物生成功能

    谷歌表示已修复 Gemini 的人物生成功能

    谷歌周三表示,将恢复允许部分用户使用其人工智能模型生成人物图像,此前今年早些时候的丑闻导致该公司暂停该功能。今年2月,谷歌的图像生成工具受到批评,因为该工具在生成人物图像时,出现了不符合历史事实的场景,包括不正确的种族描述。六个月后,谷歌再次加大力度。公司表示,将开始向订阅 Gemini Advanced 套餐的英语用户推出人物图像生成功能。企业也将能够使用该工具,该功能将在未来几天内上线。

    —— 彭博社

  • 谷歌与中国 OEM 合作以定制 Gemini 体验

    谷歌与中国 OEM 合作以定制 Gemini 体验

    在北京举行的 Google 开发者大会上,谷歌云工程副总裁 Bill Jia 表示,Google AI 正在助力 OEM 厂商打造更智能的设备。OPPO 选择了谷歌的 Gemini 模型,并与谷歌一起在海外市场推出了一系列生成式 AI 功能。首先是音频和会议摘要功能,Gemini 1.5 Pro 提供了超长输入的 AI 录音摘要功能,极大提高了工作效率。OPPO 团队基于 Gemini 1.5 Flash 开发了 AI 工具箱中的一些功能,集成在 ColorOS 智能侧边栏中,方便用户调用。

    —— 谷歌开发者微信公众号

  • Gemini 数据分析能力不足

    Gemini 数据分析能力并不像宣称的那么好

    谷歌 AI 模型 Gemini 1.5 Pro 和 1.5 Flash 据称能够凭借其“长上下文”完成以前不可能完成的任务,例如总结数百页的文档或搜索电影镜头中的场景。但新的研究表明,这些模型实际上在这些方面并不是很擅长。两项独立研究调查了 Gemini 模型和其他模型如何很好地理解大量数据。两项研究都发现 Gemini 1.5 Pro 和 1.5 Flash 很难正确回答有关大型数据集的问题;在一系列基于文档测试中,这些模型给出正确答案的概率只有40%到50%。

    马萨诸塞大学阿默斯特分校博士后、其中一项研究的合著者 Marzena Karpinska 说:“虽然像 Gemini 1.5 Pro 这样的模型在技术上可以处理长篇上下文,但我们已经看到许多案例表明,这些模型实际上并不‘理解’内容。”

    —— Techcrunch

  • 谷歌即将推出Gemini聊天机器人的选择文本功能

    谷歌即将推出Gemini聊天机器人的选择文本功能

    谷歌聊天机器人 Gemini 即将推出选择文本功能

    谷歌人工智能聊天机器人 Gemini 即将推出的“选择文本”功能与 ChatGPT 应用中的功能类似。不是直接从输出中复制,而是将打开一个新的选择界面,供用户在其中复制选择的文本。此功能将很快推出。

    —— GappsLeaks