0 引言
通过排行榜,能快速了解各模型/产品的技术竞争力、综合竞争力。
1 通用-总排行榜
闭源 + 开源
排名 | 模型 | 机构 | 总分 | 理科得分 | 文科得分 | Hard得分 | 使用方式 | 国内/国外 | 备注 |
---|---|---|---|---|---|---|---|---|---|
1 | GPT-4o | OpenAI | 81 | 81 | 76 | 85 | API | 国外 | |
2 | Claude-3.5-Sonnet-200k | Anthropic | 77 | 75 | 72 | 84 | API | 国外 | |
2 | Qwen2-72B-Instruct | 阿里巴巴 | 77 | 76 | 76 | 79 | 模型 | 国内 | 开源 |
3 | DeepSeek-V2 | 深度求索 | 76 | 74 | 76 | 78 | API | 国内 | |
3 | GLM-4-0520 | 清华&智谱AI | 76 | 74 | 74 | 79 | API | 国内 | |
3 | SenseChat5.0 | 商汤 | 76 | 73 | 75 | 78 | API | 国内 | |
4 | AndesGPT | OPPO | 75 | 76 | 76 | 72 | API | 国内 | |
4 | GPT-4-Turbo-0409 | OpenAI | 75 | 77 | 75 | 74 | API | 国外 | |
5 | GPT-4(官网) | OpenAI | 73 | 75 | 74 | 70 | 网页 | 国外 | |
6 | Baichuan4 | 百川智能 | 72 | 71 | 74 | 70 | API | 国内 | |
6 | Doubao-pro-32k-0615 | 字节跳动 | 72 | 73 | 74 | 69 | API | 国内 | |
6 | Moonshot(kimi) | 月之暗面 | 72 | 67 | 74 | 75 | 网页 | 国内 | |
6 | 山海大模型4.0 | 云知声 | 72 | 76 | 75 | 65 | API | 国内 | |
6 | 360gpt2-pro | 360 | 72 | 72 | 75 | 69 | API | 国内 | |
7 | MiniMax-abab6.5 | 稀宇科技 | 71 | 70 | 74 | 68 | API | 国内 | |
7 | 通义千问2.5 | 阿里巴巴 | 71 | 72 | 76 | 63 | API | 国内 | |
8 | 文心一言4.0 | 百度 | 69 | 74 | 73 | 60 | API | 国内 | |
8 | Llama-3-70B-Instruct | Meta | 69 | 68 | 67 | 72 | POE | 国外 | |
9 | Gemini-1.5-Pro | 68 | 72 | 71 | 62 | API | 国外 | ||
9 | 阶跃星辰step-1-32k | 阶跃星辰 | 68 | 69 | 73 | 62 | API | 国内 | |
10 | 讯飞星火V4.0 | 科大讯飞 | 67 | 71 | 70 | 60 | API | 国内 | |
11 | GPT-3.5-Turbo-0125 | OpenAI | 64 | 64 | 69 | 59 | API | 国外 | |
12 | Yi-1.5-34B-Chat-16K | 零一万物 | 63 | 66 | 71 | 52 | 模型 | 国内 | 开源 |
13 | qwen2-7b-instruct | 阿里巴巴 | 62 | 63 | 72 | 51 | 模型 | 国内 | 开源 |
14 | XVERSE-65B-2-32K | 元象科技 | 60 | 58 | 72 | 49 | API | 国内 | 开源 |
15 | qwen1.5-32b-chat | 阿里巴巴 | 57 | 61 | 74 | 35 | 模型 | 国内 | 开源 |
16 | Llama-3-8B-Instruct | Meta | 54 | 54 | 61 | 47 | 模型 | 国外 | 开源 |
17 | Baichuan2-13B-Chat-v2 | 百川智能 | 53 | 47 | 66 | 45 | 模型 | 国内 | 开源 |
17 | Yi-1.5-6B-Chat | 零一万物 | 53 | 55 | 64 | 39 | 模型 | 国内 | 开源 |
18 | Phi-3-mini-128k-instruct | 微软 | 40 | 49 | 49 | 22 | 模型 | 国外 | 开源 |
19 | gemma-7b-it | 38 | 28 | 57 | 29 | 模型 | 国外 | 开源 | |
19 | qwen2-1.5b-instruct | 阿里巴巴 | 38 | 34 | 61 | 18 | 模型 | 国内 | 开源 |
20 | Llama-2-13b-chat | Meta | 35 | 34 | 48 | 21 | 模型 | 国外 | 开源 |
开源
排名 | 模型 | 机构 | 总分 | 理科得分 | 文科得分 | Hard得分 | 使用方式 | 国内/国外 |
---|---|---|---|---|---|---|---|---|
1 | Qwen2-72B-Instruct | 阿里巴巴 | 77 | 76 | 76 | 79 | 模型 | 国内 |
2 | Llama-3-70B-Instruct | Meta | 69 | 68 | 67 | 72 | POE | 国外 |
3 | Yi-1.5-34B-Chat-16K | 零一万物 | 63 | 66 | 71 | 52 | 模型 | 国内 |
4 | qwen2-7b-instruct | 阿里巴巴 | 62 | 63 | 72 | 51 | 模型 | 国内 |
5 | XVERSE-65B-2-32K | 元象科技 | 60 | 58 | 72 | 49 | API | 国内 |
6 | qwen1.5-32b-chat | 阿里巴巴 | 57 | 61 | 74 | 35 | 模型 | 国内 |
7 | Llama-3-8B-Instruct | Meta | 54 | 54 | 61 | 47 | 模型 | 国外 |
8 | Baichuan2-13B-Chat-v2 | 百川智能 | 53 | 47 | 66 | 45 | 模型 | 国内 |
8 | Yi-1.5-6B-Chat | 零一万物 | 53 | 55 | 64 | 39 | 模型 | 国内 |
9 | Phi-3-mini-128k-instruct | 微软 | 40 | 49 | 49 | 22 | 模型 | 国外 |
10 | gemma-7b-it | 38 | 28 | 57 | 29 | 模型 | 国外 | |
10 | qwen2-1.5b-instruct | 阿里巴巴 | 38 | 34 | 61 | 18 | 模型 | 国内 |
11 | Llama-2-13b-chat | Meta | 35 | 34 | 48 | 21 | 模型 | 国外 |
X 参考文献
- SuperCLUE总排行榜 | 2024.06
标签:NLP,2024.06,AI,模型,国内,76,开源,API,72 From: https://www.cnblogs.com/johnnyzen/p/18409094