Fine-tuning 微调
Fine-tunes 微调
注意:微调的模型,一般openai账号不会轻易被封,但万一openai将账号封禁后,模型可能就访问不了了,所以可以参考 下模型的备份:https://doc.zhizengzeng.com/doc-4696672
1. Create fine-tuning job
model
(string,必填)
要微调的模型的名称。您可以选择支持的model之一。training_file
(string,必填)包含 训练数据 的已上传文件的ID。 请参阅 upload file 以了解如何上传文件。 Your dataset must be formatted as a JSONL file. Additionally, you must upload your file with the purpose fine-tune. hyperparameters
(object,选填)
用于微调工作的超参数。batch_size
(string or integer,选填,Defaults to auto)
用于训练的批次大小。批次大小是用于训练单个前向和后向传递的训练示例数量。
默认情况下,批量大小将动态配置为训练集示例数量的约 0.2%,上限为256。
通常,我们发现较大的批量大小对于更大的数据集效果更好。learning_rate_multiplier
(string or number,选填,Defaults to auto)
用于训练的学习率倍增器。微调学习率 是预训练时使用的 原始学习率 乘以 此值 得到的。
默认情况下,学习率的倍增器为 0.05、0.1 或 0.2,具体取决于最终batch_size
(较大的批量大小通常使用较大的学习率效果更好)。我们建议尝试在 0.02 到 0.2 范围内实验不同值以找出产生最佳结果的值。n_epochs
(string or integer,选填,Defaults to auto)
训练模型的时期数。一个 epoch 指的是完整地遍历一次训练数据集suffix
(string,选填,Defaults to null)
最多 18 个字符的字符串,将添加到您的微调模型名称中。
例如,“custom-model-name”后缀将生成类似 ft:gpt-3.5-turbo:openai:custom-model-name:7p4lURel 的模型名称。validation_file
(string,选填)
包含验证数据的上传文件的 ID。
如果您提供此文件,则数据将用于在微调期间定期生成验证指标。这些指标可以在微调结果文件中查看。相同的数据不应同时出现在训练文件和验证文件中。
您的数据集必须格式化为 JSONL 文件。You must upload your file with the purpose fine-tune.
有关更多详细信息,请参阅微调指南。
示例.
2. List fine-tuning jobs
after
(string,选填)
上一个分页请求中最后一个作业的标识符。limit
(integer,选填,Defaults to 20)
要检索的微调作业的数量。
示例.
3. List fine-tuning events
fine_tuning_job_id
(string,必填)
要为其获取事件的微调作业的 ID。
after
(string,选填)
上一个分页请求中最后一个事件的标识符。limit
(integer,选填,Defaults to 20)
要检索的事件数。
示例.
4. Retrieve fine-tuning job
fine_tuning_job_id
(string,必填)
要为其获取事件的微调作业的 ID。
示例.
5. Cancel fine-tuning
fine_tuning_job_id
(string,必填)
要为其获取事件的微调作业的 ID。
示例.
修改于 2024-07-27 07:22:18