智增增API
API登录演示ChatAPI应用示例API最新消息
API登录演示ChatAPI应用示例API最新消息
Github地址
智增增官网
  1. Google接口列表
  • 欢迎使用智增增
  • 概述
  • HelloWord-第一个示例
  • API最新消息
  • OpenAI接口列表
    • OpenAI概述
    • Introduction介绍
    • Audio 音频
    • Chat 聊天
    • Completions 补全(Legacy)
    • Embeddings 嵌入
    • Fine-tuning 微调
    • Batch 批处理
    • Files 文件
    • Images 图像
    • Models 模型
    • Moderations 审核
  • Anthropic接口列表
    • Claude概述
    • Claude消息
    • Claude深度思考
  • Google接口列表
    • Gemini概述
    • Gemini文本生成
    • Gemini深度思考
    • Gemini函数调用
    • Gemini图片生成
    • Gemini图片理解
    • Gemini文档理解
    • Gemini视频理解
    • Gemini音频理解
    • Gemini代码执行
    • Gemini网页上下文
    • Gemini支持谷歌搜索
    • Gemini结构化输出
    • Gemini生成视频
  • Xai接口列表
    • Grok概述
    • Grok的chat
    • Grok深度思考
  • 自有API接口
    • 查询余额
    • Modify fine-tune
  • 模型说明
    • 模型和价格说明
    • 其它模型示例
    • 费用计算说明
    • 深度思考
    • 模型微调
  • 其它说明
    • 主要概念
    • 常见问题
    • base_url地址到底是哪个?
    • 更新记录
    • 退款说明
    • 错误码
  • 接口示例
    • 模型调用示例
    • API应用示例
    • 示例场景
    • 示例代码
      • audio_transcriptions(语音识别)
      • c#语言(支持Unity)
      • c++语言
      • curl
      • gpt-4-vision.图片理解
      • java语言(支持android)
      • js
      • langchain的支持
      • object-c语言(支持苹果IOS)
      • php
      • python
      • translation(识别并翻译成英文)
      • tts.speech.语音合成
      • 兼容openai的Node.js库
      • 兼容openai的python库
      • 兼容openai的其它各种库
      • 函数调用
      • 文字生成图片
      • 流式示例stream
  • fine-tune.微调
    • 微调常见错误
    • 微调示例
    • finetune特别注意事项
  • assistant.助手
    • assistant示例
  • batch.批处理
    • batch示例
    • batch特别注意事项
  • Documentation 使用手册
  • 文章列表
    • 智增增-AI工具配置使用指南
    • 大模型怎么实现连续对话(记忆上下文)
    • ChatGPT-Next-Web使用指南
    • 为什么调用chatgpt的api接口没有返回??怎么查问题
  1. Google接口列表

Gemini生成视频

使用 Veo 生成视频#

Gemini API 提供对 Veo 2 的访问权限,这是 Google 迄今为止最强大的视频生成模型。Veo 可生成各种电影和视觉风格的视频,捕捉提示中的细微之处,以便在各个画面中一致呈现精致细节。本指南可帮助您开始使用 Gemini API 与 Veo 集成。

根据文本生成#

您可以使用以下代码通过 Veo 生成视频:
此代码大约需要 2-3 分钟才能运行完毕,但如果资源受限,则可能需要更长时间。
如果您看到错误消息,而不是视频,则表示资源有限,您的请求无法完成。在这种情况下,请再次运行代码。
生成的视频会在服务器上存储 2 天,之后会被移除。如果您想保存生成的视频的本地副本,则必须在生成后的 2 天内运行 result() 和 save()。

解析: 从生成到下载视频#

第1步:启动生成视频operation:
使用post请求:
第2步:轮循operation是否完成
注意: 1.一定要加上后面的key. 2.operations的id从上一步得到.
get方法示例:
https://api.zhizengzeng.com/google/v1beta/models/veo-2.0-generate-001/operations/883wikdz2kcw?key=${ZZZ_API_KEY}
第3步:下载视频文件
注意: 1.一定要加上后面的key. 2. 文件的id从上一步得到.
使用get方法示例:
https://api.zhizengzeng.com/google/v1beta/files/axiona1d5apd:download?alt=media&key=${ZZZ_API_KEY}

Veo 模型参数#

(命名惯例因编程语言而异。)
prompt:视频的文本提示。image 参数是可选的。
image:要用作视频第一帧的图片。prompt 参数是可选的。
negativePrompt:一个文本字符串,用于描述您想要阻止模型生成的内容
aspectRatio:更改生成的视频的宽高比。支持的值为 "16:9" 和 "9:16"。默认值为 "16:9"。
personGeneration:允许模型生成人物视频。支持以下值:
文本转视频生成:
"dont_allow":禁止在图片中包含人物或人脸。
"allow_adult":生成包含成人但不包含儿童的视频。
"allow_all":生成包含成人和儿童的视频。
图片转视频生成功能:
"dont_allow":禁止在图片中包含人物或人脸。
"allow_adult":生成包含成人但不包含儿童的视频。
请参阅限制。
numberOfVideos:请求的输出视频,1 或 2。
durationSeconds:每个输出视频的时长(以秒为单位),介于 5 和 8 之间。
enhance_prompt:启用或停用提示重写器。默认处于启用状态。

规格#

模态
文本转视频生成
图片转视频生成
请求延迟时间
最短:11 秒
最长:6 分钟(高峰时段)
可变长度生成 5-8 秒
解决方法 720p
帧速率 24 帧/秒
宽高比
16:9 - 横向
9:16 - 纵向
输入语言(文字转视频) 英语
限制
不允许在欧盟、英国、瑞士和中东及北非地区使用图片转视频功能 personGeneration
不允许在欧盟、英国、瑞士和中东及北非地区使用文字转视频功能 personGeneration: "allow_all"
修改于 2025-06-27 14:08:56
上一页
Gemini结构化输出
下一页
Grok概述
Built with