微闻

标签: 实时

  • 谷歌Gemini推出实时屏幕解读与视频分析功能

    谷歌Gemini推出实时屏幕解读与视频分析功能

    谷歌近期宣布为其人工智能助手Gemini推出两项重要更新:屏幕内容实时解读功能和视频实时分析能力。这些新功能旨在为用户提供更直观的互动体验,并使Gemini能够通过屏幕或摄像头获取实时画面并进行理解与反馈。

    据消息人士透露,这些功能得到了谷歌多模态虚拟助手项目“Project Astra”的技术加持。其中,屏幕内容实时解读功能允许用户直接通过Gemini Live查询屏幕上显示的信息,并即时获得相关解答;而视频实时分析功能则使Gemini能够通过智能手机摄像头捕捉画面并进行实时解析。

    值得注意的是,这两项新功能将作为谷歌One AI Premium计划的一部分向付费订阅用户提供。该计划涵盖了包括多模态交互、实时串流等在内的高级AI服务。此外,开发者也可通过Google AI Studio和Vertex AI平台利用Gemini的多模态实时API来构建动态应用程序,进一步扩展其应用场景。

    Gemini 2.0版本还新增了对多种媒介的支持,包括文本、图片(实验性功能)及音频(即将推出)。这些改进不仅提升了Gemini的功能多样性,也显著增强了其处理速度和生成能力。通过将先进的人工智能技术与实时数据处理相结合,谷歌正在为用户提供更加智能化的交互体验。

  • 苹果 AirPods 推出实时对话翻译功能

    苹果拟推出可实时翻译对话的 AirPods 功能

    据知情人士透露,苹果公司正在计划推出一项新的 AirPods 功能,可以让耳机将面对面的对话实时翻译成另一种语言。这项功能将作为今年晚些时候 AirPods 软件升级的一部分推出,将与即将推出的苹果移动设备操作系统iOS 19绑定。竞争对手的耳机,例如谷歌Pixel Buds,多年来就已经有这个功能。苹果自2020年以来开始在iPhone上提供其自己的翻译应用。新功能可能会给 AirPods 用户带来星际迷航般的体验。该功能的运作方式如下:如果一个说英语的人听一个讲西班牙语的人说话,iPhone会将西班牙翻译成英语并发送到他的 AirPods 上。同时他所说的英语会被翻译成西班牙语并由iPhone播放。

    —— 彭博社

  • 谷歌发布 Gemini 2.0 多模态实时串流 API

    谷歌为 Gemini 2.0 推出多模态实时串流 API

    Google 在发布 Gemini 2.0 的同时发布了新的多模态实时串流 API ,以帮助开发人员开发具有实时音频和视频流功能的应用程序。该 API 支持低延迟的双向交互,使用文本、音频和视频输入,以及音频和文本输出。这有助于实现自然、类似人类的语音对话,并能够随时打断模型输出,该模型还拥有记忆能力。该模型的视频理解功能扩展了通信模式,用户能够使用摄像头实时拍摄或共享桌面并提出相关问题。该 API 已经向开发者开放,同时也向用户提供了一个多模态实时助手的演示应用。

    —— Google 频道, Google Cloud 文档

  • WhatsApp 实时人工智能图像生成测试推出

    WhatsApp 新增实时人工智能图像生成功能

    Meta 公司正在为美国的 WhatsApp 用户推出实时人工智能图像生成测试版。在与 Meta AI 的聊天中,只要在聊天中输入文本到图像的提示,就会看到图像在添加有关要创建的内容的更多详细信息时的变化。此外,Meta 公司表示,其 Meta Llama 3 模型现在可以生成“更清晰、更高质量”的图像,并且更擅长显示文本。您还可以让 Meta AI 为您提供的任何图像制作动画,让您将它们转换为 GIF 与朋友分享。除了 WhatsApp 上的功能之外,美国用户还可以通过 Meta AI 网页版来使用实时图像生成功能。

    —— TheVerge

  • youtube 正在测试实时更新视频数据

    YouTube 应用会实时更新部分用户的视频观看次数和点赞数

    YouTube 似乎正在面向部分用户测试一项新的调整,该调整可以在你观看视频时显示几乎实时更新的观看次数和点赞数。

    在过去的几个月里,YouTube 针对部分用户悄然启用了该功能,每隔一段时间 (似乎大约每分钟一次) 就会更新一次观看和点赞计数。谷歌似乎还没有公开讨论该调整,所以很难确定该功能何时会正式上线。

    —— 9to5google

  • 现场直播

    现场直播

    星舰发射在即,现在可以通过直播看到实时画面。

    或者也可以查看 X 上的直播

  • 谷歌幻灯片推出实时鼠标指针

    谷歌幻灯片推出实时鼠标指针,以更好的促进协作

    为了促进网页版 Google 幻灯片中的协作,谷歌引入了实时指针,这是一个新功能,允许你和你的同事实时看到彼此的鼠标指针。

    通过此更新,共同创作者可以轻松地指出幻灯片中的特定文本或视觉元素,以突出重要信息和内容。

    —— 谷歌博客