LongAlign

2024-08-28LongAlign：大模型长文本处理能力提升之道
人工智能咨询培训老师叶梓转载标明出处大模型（LLMs）在处理长文本时，需要在输入序列上进行指令微调（instructionfinetuning），以确保它们能够有效地处理长文本。现有的方法主要集中在上下文扩展（contextextension），即通过位置编码扩展和对长文本的持续训练来提升模型的上下文长度。