智增增API
API登录
演示Chat
API应用示例
API最新消息
API登录
演示Chat
API应用示例
API最新消息
Github地址
智增增官网
Google接口
欢迎使用智增增
概述
HelloWord-第一个示例
API最新消息
模型和价格说明
bug反馈
OpenAI接口
OpenAI概述
使用OpenAI官方SDK
Introduction介绍
Audio 音频
Chat 聊天
Completions 补全(Legacy)
Embeddings 嵌入
Fine-tuning 微调
Batch 批处理
Files 文件
Images 图像
Models 模型
Moderations 审核
Videos 视频
Responses
Assistants
Vector stores
ChatKit
Containers
DeepSeek接口
DeepSeek概述
思考模式(reasoning_content格式)
字节豆包接口
阿里千问接口
Anthropic接口
Claude概述
使用Claude官方SDK
使用 Claude Code
Claude消息
Claude深度思考
Google接口
Gemini概述
使用Gemini官方SDK
使用 Gemini CLI
Gemini文本生成
Gemini深度思考
Gemini函数调用
Gemini图片生成
Gemini图片理解
Gemini文档理解
Gemini视频理解
Gemini音频理解
Gemini代码执行
Gemini网页上下文
Gemini支持谷歌搜索
Gemini结构化输出
Gemini生成视频
Gemini上传文件
快手可灵接口
MiniMax接口
xAI接口
Grok概述
使用xAI官方SDK
Grok的chat
Grok深度思考
智增增系统接口
查询余额
Modify fine-tune
重排序
模型说明
其它模型示例
费用计算说明
深度思考
模型微调
其它说 明
主要概念
常见问题
base_url地址到底是哪个?
更新记录
退款说明
错误码
接口示例
模型调用示例
API应用示 例
示例场景
示例代码
audio_transcriptions(语音识别)
c#语言(支持Unity)
c++语言
curl
gpt-4-vision.图片理解
java语言(支持android)
js
langchain的支持
object-c语言(支持苹果IOS)
php
python
translation(识别并翻译成英文)
tts.speech.语音合成
兼容openai的Node.js库
兼容openai的python库
兼容openai的其它各种库
函数调用
文字生成图片
流式示例stream
fine-tune.微调
微调常见错误
微调示例
finetune特别注意事项
assistant.助手
assistant示例
batch.批处理
batch示例
batch特别注意事项
video.视频
video示例
video特别注意事项
文章列表
智增增-AI工具配置使用指南
CherryStudio使用指南
如何在CherryStudio中使用nano banana
大模型怎么实现连续对话(记忆上下文)
为什么调用chatgpt的api接口没有返回??怎么查问题
NextChat(原ChatGPT-Next-Web)使用指南
API登录
演示Chat
API应用示例
API最新消息
API登录
演示Chat
API应用示例
API最新消息
Github地址
智增增官网
Google接口
Gemini音频理解
Gemini 可以分析和理解音频输入,从而实现以下用例:
描述、总结或回答与音频内容相关的问题。
提供音频转写内容。
分析音频的特定片段。
本指南介绍了如何使用 Gemini API 针对音频输入生成文本回答。
支持的音频格式
#
Gemini 支持以下音频格式 MIME 类型:
WAV - audio/wav
MP3 - audio/mp3
AIFF - audio/aiff
AAC - audio/aac
OGG Vorbis - audio/ogg
FLAC - audio/flac
音频的技术详情
#
Gemini 将每秒的音频表示为 32 个令牌;例如,一分钟的音频表示为 1,920 个令牌。
Gemini 可以“理解”非语音内容,例如鸟鸣或警笛。
单个问题中音频数据的支持时长上限为 9.5 小时。Gemini 不限制单个问题中的音频文件数量;不过,单个问题中的所有音频文件总时长不得超过 9.5 小时。
Gemini 会将音频文件下采样为 16 Kbps 的数据分辨率。
如果音频源包含多个声道,Gemini 会将这些声道合并为一个声道。
示例:
#
输入:
修改于
2025-06-24 02:30:31
上一页
Gemini视频理解
下一页
Gemini代码执行