智增增API
API登录演示ChatAPI应用示例API最新消息
API登录演示ChatAPI应用示例API最新消息
Github地址
智增增官网
  1. Google接口列表
  • 欢迎使用智增增
  • 概述
  • HelloWord-第一个示例
  • API最新消息
  • OpenAI接口列表
    • OpenAI概述
    • Introduction介绍
    • Audio 音频
    • Chat 聊天
    • Completions 补全(Legacy)
    • Embeddings 嵌入
    • Fine-tuning 微调
    • Batch 批处理
    • Files 文件
    • Images 图像
    • Models 模型
    • Moderations 审核
  • Anthropic接口列表
    • Claude概述
    • Claude消息
    • Claude深度思考
  • Google接口列表
    • Gemini概述
    • Gemini文本生成
    • Gemini深度思考
    • Gemini函数调用
    • Gemini图片生成
    • Gemini图片理解
    • Gemini文档理解
    • Gemini视频理解
    • Gemini音频理解
    • Gemini代码执行
    • Gemini网页上下文
    • Gemini支持谷歌搜索
    • Gemini结构化输出
  • Xai接口列表
    • Grok概述
    • Grok的chat
    • Grok深度思考
  • 自有API接口
    • 查询余额
    • Modify fine-tune
  • 模型说明
    • 模型和价格说明
    • 其它模型示例
    • 费用计算说明
    • 深度思考
    • 模型微调
  • 其它说明
    • 主要概念
    • 常见问题
    • base_url地址到底是哪个?
    • 更新记录
    • 退款说明
    • 错误码
  • 接口示例
    • 模型调用示例
    • API应用示例
    • 示例场景
    • 示例代码
      • audio_transcriptions(语音识别)
      • c#语言(支持Unity)
      • c++语言
      • curl
      • gpt-4-vision.图片理解
      • java语言(支持android)
      • js
      • langchain的支持
      • object-c语言(支持苹果IOS)
      • php
      • python
      • translation(识别并翻译成英文)
      • tts.speech.语音合成
      • 兼容openai的Node.js库
      • 兼容openai的python库
      • 兼容openai的其它各种库
      • 函数调用
      • 文字生成图片
      • 流式示例stream
  • fine-tune.微调
    • 微调常见错误
    • 微调示例
    • finetune特别注意事项
  • assistant.助手
    • assistant示例
  • batch.批处理
    • batch示例
    • batch特别注意事项
  • Documentation 使用手册
  • 文章列表
    • 智增增-AI工具配置使用指南
    • 大模型怎么实现连续对话(记忆上下文)
    • ChatGPT-Next-Web使用指南
    • 为什么调用chatgpt的api接口没有返回??怎么查问题
  1. Google接口列表

Gemini视频理解

Gemini 模型可以处理视频,从而支持许多先进的开发者用例,而这些用例在过去需要使用特定领域的模型。Gemini 的部分视觉功能包括:
描述视频、对其进行细分并提取信息
回答与视频内容相关的问题
提及视频中的特定时间戳
Gemini 从一开始就是作为多模态模型来构建的,我们将不断突破极限,探索更多可能。本指南介绍了如何使用 Gemini API 根据视频输入生成文本回答。

视频输入#

您可以通过以下方式将视频作为输入提供给 Gemini:
使用 File API 上传视频文件,然后向 generateContent 发出请求。对于大于 20MB 的文件、时长超过大约 1 分钟的视频,或者您想在多个请求中重复使用文件时,请使用此方法。
通过请求将内嵌视频数据传递给 generateContent。适用于较小的文件(小于 20 MB)和较短时长的文件。
直接在问题中添加 YouTube 网址。

支持的视频格式#

Gemini 支持以下视频格式 MIME 类型:
video/mp4
video/mpeg
video/mov
video/avi
video/x-flv
video/mpg
video/webm
video/wmv
video/3gpp

示例#

输入:
返回:
修改于 2025-06-24 02:30:43
上一页
Gemini文档理解
下一页
Gemini音频理解
Built with