首页 > 其他分享 >指令微调与参数微调的代码实践与分析

指令微调与参数微调的代码实践与分析

时间:2024-09-09 10:54:08浏览次数:5  
标签:微调 代码 HfArg dataset 指令 import

文章目录

    指令微调的示例代码与预训练的代码高度一致,区别主要在于指令微调数据集的构建(SFTDataset)和序列到序列损失的计算(DataCollatorForSupervisedDataset)。以下代码展示了 LLMBox 和 YuLan-Chat 中指令微调的整体训练流程。

1 import torch
2 from dataclasses import dataclass
3 from dataset.sft_dataset import SFTDataset
4 from transformers import (
5 		AutoModelForCausalLM,
6 		AutoTokenizer,
7 		HfArgumentParser,
8 		PreTrainedTokenizer,
9 		TrainingArguments,
10 		Trainer,
11 )
12 from transformers.hf_argparser import HfArg
13
14 IGNORE_INDEX = -100
15
16
17 # 用户输入超参数
18 @dataclass
19 class Arguments(TrainingArguments):
20 	# 模型结构
21 	model_name_or_path: str = HfArg(
22 		default=None,
23 		help="The model name or path, e.g., `meta-llama/Llama-2-7b-hf`",
24 	)
25

标签:微调,代码,HfArg,dataset,指令,import
From: https://blog.csdn.net/weixin_43961909/article/details/142043520

相关文章