Gemini视频理解
Gemini 从一开始就是作为多模态模型来构建的,我们将不断突破极限,探索更多可能。本指南介绍了如何使用 Gemini API 根据视频输入生成文本回答。
视频输入
通过请求将内嵌视频数据传递给 generateContent。适用于较小的文件(小于 20 MB)和较短时长的文件。
直接在问题中添加 YouTube 网址。
支持的视频格式
video/mpeg
video/mov
video/avi
video/x-flv
video/mpg
video/webm
video/wmv
video/3gpp
示例
修改于 2025-06-24 02:30:43