• 2024-09-05Meta:大语言模型可以通过自我批判取得大幅提升!
    夕小瑶科技说原创作者| 谢年年论文的审稿模式想必大家都不会陌生,一篇论文除了分配多个评审,最后还将由PC综合评估各位审稿人的reviews撰写meta-review。最近,来自Meta的研究团队将这一模式引进到大模型的对齐训练中。模型同时扮演执行者(actor)、评判者(judge)和元评判者