快速开始# 使用思考模型发起请求与任何其他内容生成请求类似。主要区别在于,您需要在 model 字段中指定某个支持思考的模型,如以下文本生成示例所示: thinkingBudget# 借助 thinkingBudget 参数,您可以为模型提供指导,帮助其了解在生成回答时可使用的思考 token 数量。令牌数量越多,推理过程通常越详细,这对处理更复杂的任务很有帮助。如果您未设置 thinkingBudget,模型将根据请求的复杂性动态调整预算。 只有 Gemini 2.5 Flash 和 2.5 Pro 支持 thinkingBudget。具体取决于问题,模型可能会超出或不足令牌预算。 thinkingBudget 必须是 128 到 32768 之间的整数。 使用 Gemini 2.5 Pro 时,您无法关闭思考功能,最低预算为 128。 如果未设置 thinkingBudget,模型将自动决定要使用多少思考预算。 thinkingBudget 必须是 0 到 24576 之间的整数。 输出思维链# 思维链内容是模型原始想法的综合版本,可提供有关模型内部推理过程的深入分析。请注意,thinkingBudget适用于模型的原始思考,而不适用于思维链内容。 您可以在请求配置中将 includeThoughts 设置为 true,以返回思维链内容。然后,您可以通过迭代 response 参数的 parts 并检查 thought 布尔值来访问摘要。 以下示例演示了如何在不流式传输的情况下启用和检索思维链内容,这会在响应中返回单个最终思维链内容: 如下代码: 修改于 2025-06-18 05:56:53