网站首页
编程语言
数据库
系统相关
其他分享
编程问答
批判
2024-09-05
Meta:大语言模型可以通过自我批判取得大幅提升!
夕小瑶科技说原创作者| 谢年年论文的审稿模式想必大家都不会陌生,一篇论文除了分配多个评审,最后还将由PC综合评估各位审稿人的reviews撰写meta-review。最近,来自Meta的研究团队将这一模式引进到大模型的对齐训练中。模型同时扮演执行者(actor)、评判者(judge)和元评判者