近日,谷歌发布了新模型Gemma 3,同时在Gemini 2.0 Flash中支持原生图像生成,并为其AI产品推出多项新功能。其中最值得关注的是谷歌AI工作室(Google AI Studio)新增的YouTube视频分析功能。
谷歌深度学习(Google DeepMind)高级产品经理洛根·基尔帕特里克(Logan Kilpatrick)在社交平台X上展示了该功能的使用方法。他表示:"我们正在引入通过AI工作室API传递YouTube链接的功能,模型可以自动理解和解析这些链接。"
在演示中,基尔帕特里克将谷歌新推出的Gemma 3 AI模型的视频链接导入谷歌AI工作室,系统显示视频预览的令牌信息为75,401个令牌。随后通过添加"总结这个视频"的提示,即可获得视频内容概要。
根据官方文档:"Gemini API和AI工作室支持将YouTube网址作为文件数据的一部分。用户可以在提示中包含YouTube网址,要求模型对视频内容进行总结、翻译或其他互动。"
目前该功能存在以下限制:
社交平台Reddit用户测试发现,该功能能够准确识别视频中特定时间戳下的画面细节,经过AI研究媒体AIM实际测试,功能表现符合预期。
尽管这项功能可以提高用户获取视频信息的效率,但其对YouTube创作者视频浏览量的长期影响仍有待观察。