谷歌Gemini推出实时屏幕解读与视频分析功能

作者：

在

谷歌近期宣布为其人工智能助手Gemini推出两项重要更新：屏幕内容实时解读功能和视频实时分析能力。这些新功能旨在为用户提供更直观的互动体验，并使Gemini能够通过屏幕或摄像头获取实时画面并进行理解与反馈。

据消息人士透露，这些功能得到了谷歌多模态虚拟助手项目“Project Astra”的技术加持。其中，屏幕内容实时解读功能允许用户直接通过Gemini Live查询屏幕上显示的信息，并即时获得相关解答；而视频实时分析功能则使Gemini能够通过智能手机摄像头捕捉画面并进行实时解析。

值得注意的是，这两项新功能将作为谷歌One AI Premium计划的一部分向付费订阅用户提供。该计划涵盖了包括多模态交互、实时串流等在内的高级AI服务。此外，开发者也可通过Google AI Studio和Vertex AI平台利用Gemini的多模态实时API来构建动态应用程序，进一步扩展其应用场景。

Gemini 2.0版本还新增了对多种媒介的支持，包括文本、图片（实验性功能）及音频（即将推出）。这些改进不仅提升了Gemini的功能多样性，也显著增强了其处理速度和生成能力。通过将先进的人工智能技术与实时数据处理相结合，谷歌正在为用户提供更加智能化的交互体验。

更多文章

评论

发表回复取消回复