谷歌AI工作室推出可调视频框架提取和上下文缓存功能

Home AI News CN 谷歌AI工作室推出可调视频框架提取和上下文缓存功能

谷歌AI工作室推出了两个令人兴奋的新功能，以响应开发者的关键需求。这个机器学习模型原型和实验的平台现在增加了本地视频帧提取和上下文缓存功能。视频帧提取功能已经上线，而上下文缓存将很快集成到Gemini API中。

通过视频帧提取，开发者可以利用上传到应用程序中的视频，让Gemini捕捉单独的帧或图像序列。这一功能增强了AI对场景的理解能力，可以生成简明的摘要，提升用户体验。您可以在Gemini API中找到这一可调整的视频帧提取功能。

上下文缓存功能使管理大规模信息集的开发者能够存储频繁访问的上下文，从而降低成本并优化工作流程。开发者无需反复将文件发送到Gemini，只需发送一次即可。谷歌强调了上下文缓存在各种场景中的实用性，例如头脑风暴内容创意、分析复杂文档，以及总结研究论文和培训材料。该功能将在Gemini API发布时提供支持。

这些更新是谷歌开发者大会上系列Gemini公告的一部分，此外还包括Gemini 1.5 Flash的推出、新的Gemma 2模型，以及一种名为PaliGemma的预训练变体。

谷歌推出Chrome桌面客户端的Gemini Nano

谷歌发布Gemma 2系列：全新27B参数模型，单TPU轻松运行