智增增API
API登录
演示Chat
API应用示例
API最新消息
API登录
演示Chat
API应用示例
API最新消息
Github地址
智增增官网
Google接口
欢迎使用智增增
概述
HelloWord-第一个示例
API最新消息
模型和价格说明
base_url地址到底是哪个?
bug反馈
OpenAI接口
OpenAI概述
使用OpenAI官方SDK
Audio
Chat
Completions
Embeddings
Fine Tuning
Batches
Files
Images
Models
Moderations
Videos
Responses
Realtime
Assistants
Vector stores
Google接口
Gemini概述
使用Gemini官方SDK
使用 Gemini CLI
Generating content
Files
Deep Research
Gemini文本生成
Gemini深度思考
Gemini函数调用
Gemini图片生成
Gemini图片理解
Gemini文档理解
Gemini视频理解
Gemini音频理解
Gemini代码执行
Gemini网页上下文
Gemini支持谷歌搜索
Gemini结构化输出
Gemini生成视频
字节豆包接口
字节豆包概述
图片生成
视频生成
阿里千问接口
阿里千问概述
图片生成
视频生成
Anthropic接口
Claude概述
使用Claude官方SDK
使用 Claude Code
Messages
Models
xAI接口
Grok概述
Chat
Responses
Images
Videos
MiniMax接口
MiniMax概述
图片生成
视频生成
快手可灵接口
可灵概述
图片生成
视频生成
DeepSeek接口
DeepSeek概述
思考模式(reasoning_content格式)
智增增系统接口
查询余额
Modify fine-tune
重排序
模型说明
其它模型示例
费用计算说明
深度思考
模型微调
其它说明
主要概念
常见问题
更新记录
退款说明
错误码
关于敏感词过滤
接口示例
模型调用示例
API应用示例
示例场景
示例代码
audio_transcriptions(语音识别)
c#语言(支持Unity)
c++语言
curl
gpt-4o.图片理解
java语言(支持android)
js
langchain的支持
object-c语言(支持苹果IOS)
php
python
translation(识别并翻译成英文)
tts.speech.语音合成
兼容openai的Node.js库
兼容openai的python库
兼容openai的其它各种库
函数调用
文字生成图片
流式示例stream
fine-tune.微调
微调常见错误
微调示例
finetune特别注意事项
assistant.助手
assistant示例
batch.批处理
batch示例
batch特别注意事项
video.视频
video示例
video特别注意事项
文章列表
如何在 智增增演示Chat中使用nano banana
智增增-AI工具配置使用指南
在 Cursor 中配置 智增增API
大模型怎么实现连续对话(记忆上下文)
为什么调用chatgpt的api接口没有返回??怎么查问题
废弃
Introduction介绍
Claude消息
Claude深度思考
ChatKit
Containers
Google接口
Gemini音频理解
Gemini 可以分析和理解音频输入,从而实现以下用例:
描述、总结或回答与音频内容相关的问题。
提供音频转写内容。
分析音频的特定片段。
本指南介绍了如何使用 Gemini API 针对音频输入生成文本回答。
支持的音频格式
#
Gemini 支持以下音频格式 MIME 类型:
WAV - audio/wav
MP3 - audio/mp3
AIFF - audio/aiff
AAC - audio/aac
OGG Vorbis - audio/ogg
FLAC - audio/flac
音频的技术详情
#
Gemini 将每秒的音频表示为 32 个令牌;例如,一分钟的音频表示为 1,920 个令牌。
Gemini 可以“理解”非语音内容,例如鸟鸣或警笛。
单个问题中音频数据的支持时长上限为 9.5 小时。Gemini 不限制单个问题中的音频文件数量;不过,单个问题中的所有音频文件总时长不得超过 9.5 小时。
Gemini 会将音频文件下采样为 16 Kbps 的数据分辨率。
如果音频源包含多个声道,Gemini 会将这些声道合并为一个声道。
示例:
#
输入:
修改于
2025-06-24 02:30:31
上一页
Gemini视频理解
下一页
Gemini代码执行