谷歌近期宣布为其人工智能助手Gemini推出两项重要更新:屏幕内容实时解读功能和视频实时分析能力。这些新功能旨在为用户提供更直观的互动体验,并使Gemini能够通过屏幕或摄像头获取实时画面并进行理解与反馈。
据消息人士透露,这些功能得到了谷歌多模态虚拟助手项目“Project Astra”的技术加持。其中,屏幕内容实时解读功能允许用户直接通过Gemini Live查询屏幕上显示的信息,并即时获得相关解答;而视频实时分析功能则使Gemini能够通过智能手机摄像头捕捉画面并进行实时解析。
值得注意的是,这两项新功能将作为谷歌One AI Premium计划的一部分向付费订阅用户提供。该计划涵盖了包括多模态交互、实时串流等在内的高级AI服务。此外,开发者也可通过Google AI Studio和Vertex AI平台利用Gemini的多模态实时API来构建动态应用程序,进一步扩展其应用场景。
Gemini 2.0版本还新增了对多种媒介的支持,包括文本、图片(实验性功能)及音频(即将推出)。这些改进不仅提升了Gemini的功能多样性,也显著增强了其处理速度和生成能力。通过将先进的人工智能技术与实时数据处理相结合,谷歌正在为用户提供更加智能化的交互体验。
发表回复