微闻

标签: Gemini

  • 谷歌Gemini平台发布新视频生成工具Veo 2

    谷歌宣布推出全新视频生成工具:Gemini平台正式上线Veo 2人工智能模型。这一功能旨在为用户提供高效的内容创作能力,并与当前市场上的竞争对手展开角逐。

    从本周开始,Gemini Advanced订阅用户可以在谷歌的应用程序中找到并使用Veo 2进行视频生成。该工具支持创建8秒时长、720p分辨率、16:9宽高比的短视频片段。通过这一功能,用户可以直接将生成的视频内容分享至TikTok、YouTube等主流平台,或者下载为带有谷歌SynthID水印的MP4文件进行保存。

    值得注意的是,Veo 2目前仅面向Gemini Advanced用户开放,并且在使用频率上设置了限制。此外,该服务暂未对Google Workspace的企业和教育计划用户全面放开。

    此次更新进一步提升了Gemini平台的内容创作能力,使用户能够更轻松地完成视频内容的制作与分发。

  • 谷歌Gemini推出实时屏幕解读与视频分析功能

    谷歌Gemini推出实时屏幕解读与视频分析功能

    谷歌近期宣布为其人工智能助手Gemini推出两项重要更新:屏幕内容实时解读功能和视频实时分析能力。这些新功能旨在为用户提供更直观的互动体验,并使Gemini能够通过屏幕或摄像头获取实时画面并进行理解与反馈。

    据消息人士透露,这些功能得到了谷歌多模态虚拟助手项目“Project Astra”的技术加持。其中,屏幕内容实时解读功能允许用户直接通过Gemini Live查询屏幕上显示的信息,并即时获得相关解答;而视频实时分析功能则使Gemini能够通过智能手机摄像头捕捉画面并进行实时解析。

    值得注意的是,这两项新功能将作为谷歌One AI Premium计划的一部分向付费订阅用户提供。该计划涵盖了包括多模态交互、实时串流等在内的高级AI服务。此外,开发者也可通过Google AI Studio和Vertex AI平台利用Gemini的多模态实时API来构建动态应用程序,进一步扩展其应用场景。

    Gemini 2.0版本还新增了对多种媒介的支持,包括文本、图片(实验性功能)及音频(即将推出)。这些改进不仅提升了Gemini的功能多样性,也显著增强了其处理速度和生成能力。通过将先进的人工智能技术与实时数据处理相结合,谷歌正在为用户提供更加智能化的交互体验。

  • “Gemini应用更新:简化登录入口及新增功能”

    自推出以来,Gemini应用一直要求用户使用Google账号登录才能访问其功能。然而,从今天起,通过隐身模式或类似模式访问网页版Gemini将直接进入聊天界面,而非之前的登录页面。需要注意的是,进行深度思考、上传文件以及查看聊天记录等操作仍需登录。此外,Android上的Gemini应用仍然要求用户登录。

    为了帮助用户快速上手,如果尚未登录Google账号,系统将在提示时自动引导登录流程,并在完成后的界面上展示一个聊天框,用户可以开始使用Gemini的交互式对话界面。如需获取Gemini的回答或与之互动,可以通过该界面进行操作。

    值得注意的是,Gemini的应用已面向全球推出扩展服务,支持更多国家、地区以及各种语言。更新内容显示,Gemini现已能够关联到Android设备上的更多应用和服务。这为用户提供更丰富的使用体验和更广泛的功能覆盖。

    在移动设备方面,用户也可在某些手机上使用Gemini移动应用。如需了解已支持的国家和地区或如何设置该移动应用,请参考相关指南。登录Web版Gemini需要通过一个要求提供电子邮件地址的界面进行身份验证流程,详情请参阅官方文档。

    此外,Dashlane作为一种强大的密码管理工具,在180个国家/地区拥有超过1,800万用户,提供了跨多个系统和应用程序管理用户凭据、访问权限控制和身份验证的安全方法。其在安全性和扩展性方面表现卓越,为用户在多设备和复杂环境中保持数据安全提供了可靠保障。

    随着技术的不断进化,Gemini的应用将不断拓展其功能和服务范围,以满足更多用户的需求。未来,我们也将进一步探索如何将这些新功能与现有的生态系统更好地集成,为用户提供更流畅、更便捷的服务体验。

  • 谷歌Gemini:集成搜索历史、深度研究与自定义功能的免费升级

    谷歌 Gemini 向所有用户免费推出搜索历史集成、深度研究及自定义版本功能

    谷歌正在利用其最大的竞争优势让 Gemini 脱颖而出:搜索。启用个性化后,Gemini 现在可以自动分析参考用户的搜索历史记录是否可以“增强”其回复。该功能由 Gemini 2.0 Flash Thinking Experimental 模型提供支持,并且只有当其 AI 模型认为搜索结果“有用”时,它才会引用。

    谷歌去年年底推出深度研究功能现在免费向所有人开放,Gemini 用户可以使用 45 多种语言免费试用深度研究,无需订阅付费计划。深度研究中 Gemini 创建研究计划并收集资料,生成有关复杂主题的全面但易于阅读的报告。去年 8 月 Gemini 推出的 Gems 的功能,允许用户创建针对特定用例的聊天机器人的自定义版本,现在也免费向所有用户开放,不再需要高级订阅,并提供了几个预制的 Gems 来帮助用户入门。

    —— The Verge, Engadget, Android Authority

  • 谷歌推出基于Gemini的全新文本嵌入模型

    谷歌推出基于 Gemini 的全新文本嵌入模型

    当地时间周五,谷歌公司在其Gemini开发者API中添加了一款新的实验性文本“嵌入”模型Gemini Embedding。​嵌入模型将单词和短语等文本输入转换为数值表示,称为嵌入,以捕捉文本的语义含义。嵌入技术被广泛应用于文档检索和分类等领域,部分原因是可以降低成本同时改善延迟。谷歌在博客文章中表示:这个嵌入模型是在 Gemini 模型本身的基础上训练的,继承了 Gemini 对语言和细微语境的理解,使其适用于广泛的用途。我们已经将我们的模型训练得非常通用,并在金融、科学、法律、搜索等不同领域提供了卓越的性能。”谷歌称 Gemini Embedding 处于容量有限的“实验阶段”,可能会发生变化。

    —— Techcrunch

  • 谷歌日历推出Gemini面板

    谷歌日历新增 Gemini 面板帮助管理日程

    谷歌正在谷歌日历中测试一个由人工智能驱动的全新 Gemini 侧面板,让用户可以快速且以对话方式查看日程安排、创建活动并查找活动详情。用户可以通过点击谷歌日历窗口右上角的“Ask Gemini”图标来访问 Gemini 聊天机器人。然后用户可以选择建议的提示或编写自己的提示。例如,Gemini 可能会建议用户“添加午餐活动”或用户与某人的“查找下一个会议”。如果想要更多建议,可以选择“更多建议”选项。用户也可以直接编写自己的提示,例如“我和艾米丽的下一次会面是什么时候?”谷歌日历是最新获得 Gemini 侧面板的 Workspace 应用,此前已在 Gmail、云端硬盘、文档、表格、幻灯片和 Chat 中推出。

    —— Techcrunch

  • 谷歌限制Gemini回答政治问题

    谷歌仍限制 Gemini 回答政治问题的方式

    ​尽管 OpenAI 等几家谷歌竞争对手在最近几个月调整了他们的 AI 聊天机器人,使其能够讨论政治敏感话题,但谷歌似乎采取了更为保守的做法。测试发现,当被要求回答某些政治问题时,谷歌的 AI 聊天机器人 Gemini 经常表示“目前没法回答关于选举和政治人物的问题”。谷歌在2024年3月宣布,在美国、印度和其他国家举行的几场选举前,Gemini 将不会回答与选举相关的问题。许多 AI 公司也采取了类似的临时限制,担心如果他们的聊天机器人出现错误会引发强烈反响。然而现在谷歌似乎显得有些格格不入。去年的重大选举已经结束,但谷歌尚未公开宣布是否会改变 Gemini 处理特定政治话题的方式。

    —— Techcrunch

  • 谷歌 Gemini 新增屏幕共享功能

    谷歌 Gemini 现允许用屏幕上的内容来提问

    谷歌正在为其人工智能助手 Gemini 添加新功能,让用户可以使用屏幕上的视频和内容实时向其提问。在巴塞罗那举行的2025年世界移动通信大会上,该公司展示了一项新的“屏幕共享”功能,该功能可让用户与 Gemini 分享手机屏幕上的内容并询问有关问题。例如该公司播放了一段视频,视频中一位用户正在购买一条宽松牛仔裤并询问 Gemini 哪些其他衣服可以与之搭配。视频搜索功能可让用户拍摄视频并在拍摄过程中向 Gemini 助手提问。谷歌表示,这些功能将于本月晚些时候向安卓 Gemini Advanced 订阅用户推出。

    —— Techcrunch

  • 谷歌表格接受Gemini驱动升级

    谷歌表格获得由AI助手 Gemini 驱动的升级

    ​谷歌正在为谷歌表格提供一项由Gemini驱动的升级,旨在帮助用户更快地分析数据,并利用人工智能将电子表格转换为图表。通过此更新,用户可以使用Gemini的功能从数据中生成洞察,例如相关性、趋势、异常值等等。现在还可以生成高级可视化效果,例如热图,他们可以将其作为静态图像插入电子表格中的单元格中。尽管该公司上个月宣布了这一更新,但谷歌本周五表示,现在所有 Workspace 商业用户都可以使用。点击表格右上角 Gemini 图标。就可提出如“根据历史数据预测下一季度净收入” 或 “按类别和设备创建支持案例的简单热图” 之类的问题。

    —— Techcrunch

  • 谷歌 Gemini code assist 对个人免费推出

    谷歌 Gemini 的 AI 编程工具现对个人免费

    谷歌今天宣布,谷歌面向企业的人工智能编程工具 Gemini Code Assist 的免费版本现已面向全球个人开发者推出。面向个人的编程工具将推出公开预览版,让学生、业余爱好者、自由职业者和初创公司更容易获得“具有最新AI功能”的编程助手。该免费编码工具可以安装在 VS Code、GitHub 和 JetBrains 开发者环境中,并支持公共领域的所有编程语言。这款编码工具目前支持三十八种语言和最多 128k token 的上下文窗口。对于个人免费版,谷歌每月提供180,000次代码补全,谷歌将其描述为“上限如此之高,即使是当今最专注的专业开发人员也很难超越它。”

    —— The Verge