智增增API
API登录
演示Chat
API应用示例
API最新消息
API登录
演示Chat
API应用示例
API最新消息
Github地址
智增增官网
Google接口列表
欢迎使用智增增
概述
HelloWord-第一个示例
API最新消息
OpenAI接口列表
OpenAI概述
Introduction介绍
Audio 音频
Chat 聊天
Completions 补全(Legacy)
Embeddings 嵌入
Fine-tuning 微调
Batch 批处理
Files 文件
Images 图像
Models 模型
Moderations 审核
Anthropic接口列表
Claude概述
Claude消息
Claude深度思考
Google接口列表
Gemini概述
Gemini文本生成
Gemini深度思考
Gemini函数调用
Gemini图片生成
Gemini图片理解
Gemini文档理解
Gemini视频理解
Gemini音频理解
Gemini代码执行
Gemini网页上下文
Gemini支持谷歌搜索
Gemini结构化输出
Xai接口列表
Grok概述
Grok的chat
Grok深度思考
自有API接口
查询余额
Modify fine-tune
模型说明
模型和价格说明
其它模型示例
费用计算说明
深度思考
模型微调
其它说明
主要概念
常见问题
base_url地址到底是哪个?
更新记录
退款说明
错误码
接口示例
模型调用示例
API应用示例
示例场景
示例代码
audio_transcriptions(语音识别)
c#语言(支持Unity)
c++语言
curl
gpt-4-vision.图片理解
java语言(支持android)
js
langchain的支持
object-c语言(支持苹果IOS)
php
python
translation(识别并翻译成英文)
tts.speech.语音合成
兼容openai的Node.js库
兼容openai的python库
兼容openai的其它各种库
函数调用
文字生成图片
流式示例stream
fine-tune.微调
微调常见错误
微调示例
finetune特别注意事项
assistant.助手
assistant示例
batch.批处理
batch示例
batch特别注意事项
Documentation 使用手册
文章列表
智增增-AI工具配置使用指南
大模型怎么实现连续对话(记忆上下文)
ChatGPT-Next-Web使用指南
为什么调用chatgpt的api接口没有返回??怎么查问题
Google接口列表
Gemini文档理解
Gemini API 支持 PDF 输入,包括长文档(最多 1, 000 页)。 Gemini 模型使用原生视觉功能处理 PDF,因此能够理解文档中的文本和图片内容。借助原生 PDF 视觉支持,Gemini 模型能够:
分析文档中的图表、图表和表格
将信息提取为结构化输出格式
回答有关文档中视觉内容和文本内容的问题
总结文档
转写文档内容(例如转写为 HTML),保留布局和格式,以便在下游应用中使用
PDF 输入
#
对于小于 20MB 的 PDF 载荷,您可以选择上传 base64 编码的文档,也可以直接上传本地存储的文件。
作为内嵌数据
您可以直接通过网址处理 PDF 文档。以下代码段展示了如何执行此操作:
修改于
2025-06-24 02:25:36
上一页
Gemini图片理解
下一页
Gemini视频理解