智增增API
API登录
演示Chat
API应用示例
API最新消息
API登录
演示Chat
API应用示例
API最新消息
Github地址
智增增官网
Google接口
欢迎使用智增增
概述
HelloWord-第一个示例
API最新消息
模型和价格说明
base_url地址到底是哪个?
bug反馈
OpenAI接口
OpenAI概述
使用OpenAI官方SDK
Introduction介绍
Audio
Chat 聊天
Completions 补全(Legacy)
Embeddings 嵌入
Fine-tuning 微调
Batch 批处理
Files 文件
Images
Models 模型
Moderations 审核
Videos
Responses
Realtime
Assistants
Vector stores
ChatKit
Containers
Google接口
Gemini概述
使用Gemini官方SDK
使用 Gemini CLI
Gemini文本生成
Gemini深度思考
Gemini函数调用
Gemini图片生成
Gemini图片理解
Gemini文档理解
Gemini视频理解
Gemini音频理解
Gemini代码执行
Gemini网页上下文
Gemini支持谷歌搜索
Gemini结构化输出
Gemini生成视频
Gemini上传文件
DeepSeek接口
DeepSeek概述
思考模式(reasoning_content格式)
字节豆包接口
字节豆包概述
图片生成
视频生成
阿里千问接口
阿里千问概述
图片生成
视频生成
Anthropic接口
Claude概述
使用Claude官方SDK
使用 Claude Code
Claude消息
Claude深度思考
xAI接口
Grok概述
使用xAI官方SDK
Grok的chat
Grok深度思考
MiniMax接口
MiniMax概述
图片生成
视频生成
快手可灵接口
智增增系统接口
查询余额
Modify fine-tune
重排序
模型说明
其它模型示例
费用计算说明
深度思考
模型微调
其它说明
主要概念
常见问题
更新记录
退款说明
错误码
关于敏感词过滤
接口示例
模型调用示例
API应用示例
示例场景
示例代码
audio_transcriptions(语音识别)
c#语言(支持Unity)
c++语言
curl
gpt-4o.图片理解
java 语言(支持android)
js
langchain的支持
object-c语言(支持苹果IOS)
php
python
translation(识别并翻译成英文)
tts.speech.语音合成
兼容openai的Node.js库
兼容openai的python库
兼容openai的其它各种库
函数调用
文字生成图片
流式示例stream
fine-tune.微调
微调常见错误
微调示例
finetune特别注意事项
assistant.助手
assistant示例
batch.批处理
batch示例
batch特别注意事项
video.视频
video示例
video特别注意事项
文章列表
如何在智增增演示Chat中使用nano banana
智增增-AI工具配置使用指南
在 Cursor 中配置 智增增API
大模型怎么实现连续对话(记忆上下文)
为什么调用chatgpt的api接口没有返回??怎么查问题
API登录
演示Chat
API应用示例
API最新消息
API登录
演示Chat
API应用示例
API最新消息
Github地址
智增增官网
Google接口
Gemini文档理解
Gemini API 支持 PDF 输入,包括长文档(最多 1, 000 页)。 Gemini 模型使用原生视觉功能处理 PDF,因此能够理解文档中的文本和图片内容。借助原生 PDF 视觉支持,Gemini 模型能够:
分析文档中的图表、图表和表格
将信息提取为结构化输出格式
回答有关文档中视觉内容和文本内容的问题
总结文档
转写文档内容(例如转写为 HTML),保留布局和格式,以便在下游应用中使用
PDF 输入
#
对于小于 20MB 的 PDF 载荷,您可以选择上传 base64 编码的文档,也可以直接上传本地存储的文件。
作为内嵌数据
您可以直接通过网址处理 PDF 文档。以下代码段展示了如何执行此操作:
修改于
2025-06-24 02:25:36
上一页
Gemini图片理解
下一页
Gemini视频理解