智增增API
API登录
演示Chat
API应用示例
API最新消息
API登录
演示Chat
API应用示例
API最新消息
Github地址
智增增官网
Google接口
欢迎使用智增增
概述
HelloWord-第一个示例
API最新消息
模型和价格说明
base_url地址到底是哪个?
bug反馈
OpenAI接口
OpenAI概述
使用OpenAI官方SDK
Introduction介绍
Audio
Chat 聊天
Completions 补全(Legacy)
Embeddings 嵌入
Fine-tuning 微调
Batch 批处理
Files 文件
Images
Models 模型
Moderations 审核
Videos
Responses
Realtime
Assistants
Vector stores
ChatKit
Containers
Google接口
Gemini概述
使用Gemini官方SDK
使用 Gemini CLI
Gemini文本生成
Gemini深度思考
Gemini函数调用
Gemini图片生成
Gemini图片理解
Gemini文档理解
Gemini视频理解
Gemini音频理解
Gemini代码执行
Gemini网页上下文
Gemini支持谷歌搜索
Gemini结构化输出
Gemini生成视频
Gemini上传文件
DeepSeek接口
DeepSeek概述
思考模式(reasoning_content格式)
字节豆包接口
字节豆包概述
图片生成
视频生成
阿里千问接口
阿里千问概述
图片生成
视频生成
Anthropic接口
Claude概述
使用Claude官方SDK
使用 Claude Code
Claude消息
Claude深度思考
xAI接口
Grok概述
使用xAI官方SDK
Grok的chat
Grok深度思考
MiniMax接口
MiniMax概述
图片生成
视频生成
快手可灵接口
智增增系统接口
查询余额
Modify fine-tune
重排序
模型说明
其它模型示例
费用计算说明
深度思考
模型微调
其它说明
主要概念
常见问题
更新记录
退款说明
错误码
关于敏感词过滤
接口示例
模型调用示例
API应用示例
示例场景
示例代码
audio_transcriptions(语音识别)
c#语言(支持Unity)
c++语言
curl
gpt-4o.图片理解
java 语言(支持android)
js
langchain的支持
object-c语言(支持苹果IOS)
php
python
translation(识别并翻译成英文)
tts.speech.语音合成
兼容openai的Node.js库
兼容openai的python库
兼容openai的其它各种库
函数调用
文字生成图片
流式示例stream
fine-tune.微调
微调常见错误
微调示例
finetune特别注意事项
assistant.助手
assistant示例
batch.批处理
batch示例
batch特别注意事项
video.视频
video示例
video特别注意事项
文章列表
如何在智增增演示Chat中使用nano banana
智增增-AI工具配置使用指南
在 Cursor 中配置 智增增API
大模型怎么实现连续对话(记忆上下文)
为什么调用chatgpt的api接口没有返回??怎么查问题
API登录
演示Chat
API应用示例
API最新消息
API登录
演示Chat
API应用示例
API最新消息
Github地址
智增增官网
Google接口
Gemini音频理解
Gemini 可以分析和理解音频输入,从而实现以下用例:
描述、总结或回答与音频内容相关的问题。
提供音频转写内容。
分析音频的特定片段。
本指南介绍了如何使用 Gemini API 针对 音频输入生成文本回答。
支持的音频格式
#
Gemini 支持以下音频格式 MIME 类型:
WAV - audio/wav
MP3 - audio/mp3
AIFF - audio/aiff
AAC - audio/aac
OGG Vorbis - audio/ogg
FLAC - audio/flac
音频的技术详情
#
Gemini 将每秒的音频表示为 32 个令牌;例如,一分钟的音频表示为 1,920 个令牌。
Gemini 可以“理解”非语音内容,例如鸟鸣或警笛。
单个问题中音频数据的支持时长上限为 9.5 小时。Gemini 不限制单个问题中的音频文件数量;不过,单个问题中的所有音频文件总时长不得超过 9.5 小时。
Gemini 会将音频文件下采样为 16 Kbps 的数据分辨率。
如果音频源包含多个声道,Gemini 会将这些声道合并为一个声道。
示例:
#
输入:
修改于
2025-06-24 02:30:31
上一页
Gemini视频理解
下一页
Gemini代码执行