网站首页
编程语言
数据库
系统相关
其他分享
编程问答
TMBENCH
2024-08-02
探索大模型的“心理理论”能力:TMBENCH基准测试
人工智能咨询培训老师叶梓转载标明出处心理理论是理解他人信念、意图、情感等心理状态的能力,对人类社会交往至关重要。近期研究引发了关于LLMs是否展现出ToM的辩论。然而,现有的评估方法受限于范围狭窄、主观判断和潜在的数据污染等问题,无法提供充分的评估。为了填补这一空白