微闻

标签: Gemini

  • 谷歌 Gemini 新增屏幕共享功能

    谷歌 Gemini 现允许用屏幕上的内容来提问

    谷歌正在为其人工智能助手 Gemini 添加新功能,让用户可以使用屏幕上的视频和内容实时向其提问。在巴塞罗那举行的2025年世界移动通信大会上,该公司展示了一项新的“屏幕共享”功能,该功能可让用户与 Gemini 分享手机屏幕上的内容并询问有关问题。例如该公司播放了一段视频,视频中一位用户正在购买一条宽松牛仔裤并询问 Gemini 哪些其他衣服可以与之搭配。视频搜索功能可让用户拍摄视频并在拍摄过程中向 Gemini 助手提问。谷歌表示,这些功能将于本月晚些时候向安卓 Gemini Advanced 订阅用户推出。

    —— Techcrunch

  • 谷歌表格接受Gemini驱动升级

    谷歌表格获得由AI助手 Gemini 驱动的升级

    ​谷歌正在为谷歌表格提供一项由Gemini驱动的升级,旨在帮助用户更快地分析数据,并利用人工智能将电子表格转换为图表。通过此更新,用户可以使用Gemini的功能从数据中生成洞察,例如相关性、趋势、异常值等等。现在还可以生成高级可视化效果,例如热图,他们可以将其作为静态图像插入电子表格中的单元格中。尽管该公司上个月宣布了这一更新,但谷歌本周五表示,现在所有 Workspace 商业用户都可以使用。点击表格右上角 Gemini 图标。就可提出如“根据历史数据预测下一季度净收入” 或 “按类别和设备创建支持案例的简单热图” 之类的问题。

    —— Techcrunch

  • 谷歌 Gemini code assist 对个人免费推出

    谷歌 Gemini 的 AI 编程工具现对个人免费

    谷歌今天宣布,谷歌面向企业的人工智能编程工具 Gemini Code Assist 的免费版本现已面向全球个人开发者推出。面向个人的编程工具将推出公开预览版,让学生、业余爱好者、自由职业者和初创公司更容易获得“具有最新AI功能”的编程助手。该免费编码工具可以安装在 VS Code、GitHub 和 JetBrains 开发者环境中,并支持公共领域的所有编程语言。这款编码工具目前支持三十八种语言和最多 128k token 的上下文窗口。对于个人免费版,谷歌每月提供180,000次代码补全,谷歌将其描述为“上限如此之高,即使是当今最专注的专业开发人员也很难超越它。”

    —— The Verge

  • 谷歌Gemini将新增视频生成功能

    谷歌 Gemini 助理或将新增视频生成功能

    谷歌一直在为其人工智能数字助理 Gemini 添加功能。我们已经看到了一些功能,这些功能增加了更深层次的上下文,简化了文件处理,甚至可以跨应用链接。近期 Google 移动应用中包含代码显示,谷歌正在开发一项视频生成功能,可能会在未来的更新中添加到 Gemini 中。Google 应用 v16.6.23 包含的代码暗示谷歌将为 Gemini 添加视频生成功能。代码显示,“robin”旁边提到了“videogen”,而“robin”正是谷歌应用中 Gemini 的代号。此功能尚未上线,其发布日期尚不确定。

    —— AndroidAuthority

  • 谷歌 Gemini 免费上传文件分析功能即时可用

    谷歌 Gemini 文件分析正在向用户免费推出

    谷歌 ​Gemini 提供了一项实用功能,只要用户订阅了 Gemini Advanced 服务,就可以通过上传文档或电子表格来获取答案、生成摘要和创建图表。​谷歌正在取消 Gemini 上传和分析功能的订阅要求。​Reddit 论坛上的用户报告显示,即使在 Gemini 的免费版本中现在也可以使用上传选项。​没有订阅的用户将获得固定的每日配额来使用该功能,但没有确切的数字,因为谷歌尚未更新这项功能的支持文档。当使用该功能时,将看到已使用的每日配额百分比。超出限制,将需要等待几个小时才能重置配额。​这项功能似乎正在逐步推出,预计将在未来几天内覆盖所有用户。

    —— Androidauthority

  • 谷歌 Gemini AI更新记忆功能

    谷歌 Gemini AI 现在可以回忆过去的对话

    谷歌公司 Gemini AI 助手现在可以回忆过去的对话以提供更相关的回复,用户需要订阅 Gemini Advanced 服务。通过这次更新,用户不再需要回顾之前的聊天或搜索主题来继续对话,因为 Gemini 已经拥有了所需的上下文。​用户还可以让 Gemini 总结之前的对话并在现有项目基础上进行扩展。谷歌已经广泛推出了 Gemini “记住”你的偏好的功能,但这次最新的更新更进一步,让聊天机器人可以参考过去的讨论。​用户可以在 Gemini 网页或应用上试用新的英语回忆功能。谷歌计划在 “未来几周内” 将该功能推广到更多语言以及谷歌 Workspace 商业版和企业版客户。

    —— TheVerge

  • 谷歌 Gemini 应用添加新预览模型

    Google Gemini 应用添加了 2.0 Pro 和 2.0 Flash Thinking 预览模型

    谷歌在 2.0 Flash 面向消费者发布后,推出了新的预览模型 2.0 Pro 和 2.0 Flash Thinking ,这些模型将在 Gemini 应用中提供测试。谷歌表示,2.0 Pro Experimental 是其“迄今为止编码性能和复杂提示方面的最佳模型”。它还“比我们迄今为止发布的任何模型都具有更好的理解和推理世界知识的能力”。Gemini Advanced 订阅用户今天开始能够在网页和应用上预览 2.0 Pro Experimental。

    Gemini 2.0 Flash Thinking Experimental 将在 Gemini 应用中向所有用户免费提供测试。谷歌表示,该模型具有 2.0 Flash 的速度和性能,并表示“经过训练,可以将提示分解为一系列步骤,以增强其推理能力并提供更好的响应。” 同时,谷歌还提供了“2.0 Flash Thinking Experimental with apps”,可以推理并“与 YouTube、搜索和谷歌地图等应用交互”。

    —— 9to5google

  • 谷歌更新Gemini语言模型系列

    Google 更新 Gemini 2.0 模型系列

    谷歌周三宣布更新其 Gemini 多模态大型语言模型系列,包括一条新产品线。谷歌周三向正式推出了可用于生产环境的 Gemini 2.0 Flash,还推出了更便宜的 Flash-Lite,并发布了有 200 万个 token 上下文窗口的旗舰“Pro”模型的新版本,现在已经开放免费测试。

    Gemini Flash-Lite 上的输入每 100 万个 token 的费用为 0.019 美元。相比之下,OpenAI 旗舰模型的经济版价格为 0.075 美元,DeepSeek-V3 廉价模型价格为 0.014 美元,不过 DeepSeek 在其网站上表示,价格将于 2 月 8 日上涨五倍。

    —— 谷歌博客,路透社

  • 谷歌Gemini应用升级Flash 2.0版本

    ​谷歌Gemini AI应用借助Flash 2.0变得更快

    ​谷歌周四宣布,Gemini 应用将获得 Gemini 2.0 Flash AI 模型。谷歌公司在一篇帖子中表示,升级后的模型“在多项关键基准测试中提供快速响应和更强的性能,为头脑风暴、学习或写作等日常任务提供帮助” 。这项变更正在 Gemini 的网页和移动应用中推出,并将向所有用户开放。谷歌还表示,用户在“接下来的几周内”仍然可以使用 Gemini 1.5 Flash 和 1.5 Pro。谷歌还表示,Gemini 的图像生成功能现在使用该公司最新版本的 Imagen 3 AI 文本转图像生成器。该模型“提供更丰富的细节和纹理”并且“更准确地遵循您的指令”。

    —— TheVerge

  • 谷歌发布 Gemini 2.0 多模态实时串流 API

    谷歌为 Gemini 2.0 推出多模态实时串流 API

    Google 在发布 Gemini 2.0 的同时发布了新的多模态实时串流 API ,以帮助开发人员开发具有实时音频和视频流功能的应用程序。该 API 支持低延迟的双向交互,使用文本、音频和视频输入,以及音频和文本输出。这有助于实现自然、类似人类的语音对话,并能够随时打断模型输出,该模型还拥有记忆能力。该模型的视频理解功能扩展了通信模式,用户能够使用摄像头实时拍摄或共享桌面并提出相关问题。该 API 已经向开发者开放,同时也向用户提供了一个多模态实时助手的演示应用。

    —— Google 频道, Google Cloud 文档