2024-12-30Proj CJI Paper Reading: OffsetBias: Leveraging Debiased Data for Tuning Evaluators目的:reducebiasofLLMsMethod:使用GPT4生成off-topic(完全无关的话题)用GPT3.5生成遵照off-topic回答的badresponse用goodresponse,badresponse来微调模型,减少bias注意:这里off-topic不会作为用于防止注入的dataAbstract5.