快速开始

使用思考模型发起请求与任何其他内容生成请求类似。主要区别在于，您需要在 model 字段中指定某个支持思考的模型，如以下文本生成示例所示：

thinkingBudget

借助 thinkingBudget 参数，您可以为模型提供指导，帮助其了解在生成回答时可使用的思考 token 数量。令牌数量越多，推理过程通常越详细，这对处理更复杂的任务很有帮助。如果您未设置 thinkingBudget，模型将根据请求的复杂性动态调整预算。

只有 Gemini 2.5 Flash 和 2.5 Pro 支持 thinkingBudget。具体取决于问题，模型可能会超出或不足令牌预算。

以下是每种模型类型的配置要求。

Gemini 2.5 Pro

thinkingBudget 必须是 128 到 32768 之间的整数。
使用 Gemini 2.5 Pro 时，您无法关闭思考功能，最低预算为 128。
如果未设置 thinkingBudget，模型将自动决定要使用多少思考预算。

Gemini 2.5 Flash

thinkingBudget 必须是 0 到 24576 之间的整数。

将思考预算设置为 0 会停用思考功能。

如下代码:

思维链内容是模型原始想法的综合版本，可提供有关模型内部推理过程的深入分析。请注意，thinkingBudget适用于模型的原始思考，而不适用于思维链内容。

您可以在请求配置中将 includeThoughts 设置为 true，以返回思维链内容。然后，您可以通过迭代 response 参数的 parts 并检查 thought 布尔值来访问摘要。

以下示例演示了如何在不流式传输的情况下启用和检索思维链内容，这会在响应中返回单个最终思维链内容：
如下代码:

返回示例: