网站首页
编程语言
数据库
系统相关
其他分享
编程问答
随文
2024-08-19
全面盘点:大模型常用评测基准大全,全网最详尽版本,CSDN独家福利随文附赠!
基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。文章目录通用评测基准SuperCLUEC-EvalOpenLLMLeaderboardChatbotArenaGLUE具体评测基准MMLU(MassiveMultitaskLanguageUnderstanding)AGIEvalGSM8KMT-benchPromptBench总结C