标签: 实时

  • 谷歌发布 Gemini 2.0 多模态实时串流 API

    谷歌为 Gemini 2.0 推出多模态实时串流 API

    Google 在发布 Gemini 2.0 的同时发布了新的多模态实时串流 API ,以帮助开发人员开发具有实时音频和视频流功能的应用程序。该 API 支持低延迟的双向交互,使用文本、音频和视频输入,以及音频和文本输出。这有助于实现自然、类似人类的语音对话,并能够随时打断模型输出,该模型还拥有记忆能力。该模型的视频理解功能扩展了通信模式,用户能够使用摄像头实时拍摄或共享桌面并提出相关问题。该 API 已经向开发者开放,同时也向用户提供了一个多模态实时助手的演示应用。

    —— Google 频道, Google Cloud 文档

  • WhatsApp 实时人工智能图像生成测试推出

    WhatsApp 新增实时人工智能图像生成功能

    Meta 公司正在为美国的 WhatsApp 用户推出实时人工智能图像生成测试版。在与 Meta AI 的聊天中,只要在聊天中输入文本到图像的提示,就会看到图像在添加有关要创建的内容的更多详细信息时的变化。此外,Meta 公司表示,其 Meta Llama 3 模型现在可以生成“更清晰、更高质量”的图像,并且更擅长显示文本。您还可以让 Meta AI 为您提供的任何图像制作动画,让您将它们转换为 GIF 与朋友分享。除了 WhatsApp 上的功能之外,美国用户还可以通过 Meta AI 网页版来使用实时图像生成功能。

    —— TheVerge

  • youtube 正在测试实时更新视频数据

    YouTube 应用会实时更新部分用户的视频观看次数和点赞数

    YouTube 似乎正在面向部分用户测试一项新的调整,该调整可以在你观看视频时显示几乎实时更新的观看次数和点赞数。

    在过去的几个月里,YouTube 针对部分用户悄然启用了该功能,每隔一段时间 (似乎大约每分钟一次) 就会更新一次观看和点赞计数。谷歌似乎还没有公开讨论该调整,所以很难确定该功能何时会正式上线。

    —— 9to5google

  • 现场直播

    现场直播

    星舰发射在即,现在可以通过直播看到实时画面。

    或者也可以查看 X 上的直播

  • 谷歌幻灯片推出实时鼠标指针

    谷歌幻灯片推出实时鼠标指针,以更好的促进协作

    为了促进网页版 Google 幻灯片中的协作,谷歌引入了实时指针,这是一个新功能,允许你和你的同事实时看到彼此的鼠标指针。

    通过此更新,共同创作者可以轻松地指出幻灯片中的特定文本或视觉元素,以突出重要信息和内容。

    —— 谷歌博客