首页 > 其他分享 >day9[探索 InternLM 模型能力边界]

day9[探索 InternLM 模型能力边界]

时间:2024-10-04 13:44:49浏览次数:8  
标签:输出 xxxx 边界 day9 模型 20b InternLM chat internlm2.5

Bad Case 1:

模型服务来源 https://opencompass.org.cn/arena
您的输入 10月中旬去北京穿什么衣服
模型A internlm2.5-20b-chat
模型B Doubao-pro-32k/240828 (字节豆包)
模型A输出
|

| 模型B输出 |

|

| 其他补充 | xxxx |

Bad Case 2:

模型服务来源 https://opencompass.org.cn/arena
您的输入 怎么减轻黑眼圈
模型A internlm2.5-20b-chat
模型B Hunyuan-pro (腾讯混元)
模型A输出
模型B输出
|

| 其他补充 | xxxx |

Bad Case 3:

模型服务来源 https://opencompass.org.cn/arena
您的输入 推荐一些安全有效清洁头皮的洗发露
模型A internlm2.5-20b-chat
模型B MoonShot-v1-32K (月之暗面)
模型A输出
模型B输出

|
| 其他补充 | xxxx |

Bad Case 4:

模型服务来源 https://opencompass.org.cn/arena
您的输入 给中国的航空公司排名
模型A internlm2.5-20b-chat
模型B Qwen-Max-0428 (阿里通义千问)
模型A输出
|

| 模型B输出 |
|
| 其他补充 | xxxx |

Bad Case 5:

模型服务来源 自行部署/compassarea
您的输入 出国旅游推荐办理哪家银行的信用卡
模型A internlm2.5-20b-chat
模型B Spark-v4.0-Ultra w/search (讯飞星火)
模型A输出
模型B输出
|

| 其他补充 | xxxx |

Good Case 1:

模型服务来源 https://opencompass.org.cn/arena
您的输入 新冠疫情什么时候开始的
模型A internlm2.5-20b-chat
模型B ERNIE-4.0-8K (百度文心一言)
模型A输出
模型B输出
|

| 其他补充 | xxxx |

Good Case 2:

模型服务来源 https://opencompass.org.cn/arena
您的输入 推荐北京3日游的旅游路线,用中文回答
模型A internlm2.5-20b-chat
模型B Llama3-70B-Instruct (Meta)
模型A输出
 |

| 模型B输出 |
|
| 其他补充 | xxxx |

Good Case 3:

模型服务来源 https://opencompass.org.cn/arena
您的输入 AI什么时候将会取代人类
模型A internlm2.5-20b-chat
模型B abab6.5-chat (MiniMax)
模型A输出
模型B输出
其他补充 xxxx

Good Case 4:

模型服务来源 https://opencompass.org.cn/arena
您的输入 小狗的身体语言的含义
模型A internlm2.5-20b-chat
模型B Mixtral-8x22B-Instruct-v0.1 (Mistral AI)
模型A输出
|

| 模型B输出 |
|
| 其他补充 | xxxx |

Good Case 5:

模型服务来源 https://opencompass.org.cn/arena
您的输入 人参果是什么
模型A internlm2.5-20b-chat
模型B Yi-1.5-34B-Chat (零一万物)
模型A输出
|

| 模型B输出 |
|
| 其他补充 | xxxx |

标签:输出,xxxx,边界,day9,模型,20b,InternLM,chat,internlm2.5
From: https://www.cnblogs.com/happyrainyday-2024/p/18446501

相关文章

  • iLogtail 进化论:重塑可观测采集的技术边界
    作者:余韬(迅飞)采集代理发展回顾iLogtail作为一款开创性的轻量级日志采集器,历经13载风雨,始终致力于高效地从多元化的数据源中萃取、处理可观测信息,并无缝传输至阿里云日志服务或各类日志分析平台。今年,适逢iLogtail开源两周年的里程碑时刻,我们将回顾iLogtail的技术演进之......
  • YOLOv10改进策略【损失函数篇】| Shape-IoU:考虑边界框形状和尺度的更精确度量
    一、本文介绍本文记录的是改进YOLOv10的损失函数,将其替换成Shape-IoU。现有边界框回归方法通常考虑真实GT(GroundTruth)框与预测框之间的几何关系,通过边界框的相对位置和形状计算损失,但忽略了边界框本身的形状和尺度等固有属性对边界框回归的影响。为了弥补现有研究的不足,Sh......
  • day8[OpenCompass 评测 InternLM-1.8B 实践]
    环境配置创建开发机和conda环境数据准备评测数据集启动评测(10%A1008GB资源)使用命令行配置参数法进行评测评测完成后,将会看到:......
  • 【电磁学,向量场理论和Maxwell方程】二维FDTD(有限差分时域)解决完全电导体边界条件问题
     ......
  • 【基础岛·第6关】OpenCompass 评测 InternLM-1.8B 实践
    目录1.概览2.环境配置2.1创建开发机和conda环境2.2安装——面向GPU的环境安装3.数据准备3.1评测数据集3.2InternLM和ceval相关的配置文件4.启动测评4.1使用命令行配置参数法进行评测4.2使用配置文件修改参数法进行评测1.概览在OpenCompass中评估一个模型通常包括......
  • WPF Panel超出边界
    关于StackPanel和Grid这两种常用的WPF布局控件的不同行为1.StackPanel的行为:StackPanel设计用于简单地将元素堆叠在一起(垂直或水平)。它不会限制其子元素的大小,允许它们按需增长。这意味着:子元素可以超出StackPanel的边界StackPanel不会自动调整大小以适应其内容如果内......
  • 闭眼,我触碰群论的边界
    基础群给定一个集合\(G\)和集合上的二元运算\(\times\),满足:封闭性,若\(a,b\inG\),则\(a\timesb\inG\)。结合律,对于任意\(a,b,c\inG\),则\((a\timesb)\timesc=a\times(b\timesc)\)。存在单位元,\(e[x]=x\)。存在逆元。则称\(G\)在运算\(\times\)下是一个群......
  • 数据无边界!SAP BI助您实现全球化业务智能管理
    在当今全球化的商业环境中,企业面临着海量数据的挑战与机遇。数据如同企业发展的血液,流淌在各个业务环节之中,而如何有效地管理和利用这些数据,成为企业在全球竞争中脱颖而出的关键因素。SAPBI(BusinessIntelligence)作为一款强大的商务智能解决方案,正以其卓越的性能助力企业实现全球......
  • Opencv边界填充、图像数值、图像融合与形态学运算处理方法
     首先导入库和图片,图片根据自己的路径修改importnumpyasnpimportcv2importmatplotlib.pyplotasplt%matplotlibinline#readimg1andimg2img1=cv2.imread(r'material\b.png')img2=cv2.imread(r'material\a.png')img3=cv2.imread(r'material......
  • Java中的泛型编程:深入理解类型参数与类型边界的使用
    Java中的泛型编程:深入理解类型参数与类型边界的使用大家好,我是微赚淘客返利系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!在Java中,泛型编程是一种重要的特性,它允许我们在编写代码时使用类型参数,从而提高代码的可重用性和类型安全性。本文将深入探讨Java中的泛型,包括类型参......