OpenCompass

2024-11-26书生大模型第四期 | 基础岛 task6 OpenCompass 评测
目录使用OpenCompass评测浦语API记录环境准备后续运行会碰到的问题：代码准备测评运行任务来源：Tutorial/docs/L1/Evaluation/task.mdatcamp4·InternLM/Tutorial·GitHub使用OpenCompass评测浦语API记录环境准备condacreate-nopencompasspython=3.10
2024-12-112023 ICPC 合肥区域赛题解更新至 6 题（The 2023 ICPC Asia Hefei Regional Contest ）
Preface只能说阅读理解能力有待提高，\(B\)题看了半天愣是看不懂一点。只能跳了。依旧是复习篇，感觉队友当时开出来的\(dp\)难度不低，感慨张神的强大。我会在代码一些有必要的地方加上注释，签到题可能一般就不会写了.以下是代码火车头：#include<iostream>#include<algorithm>#i
2024-12-11TIKOOL太酷无线内部通话系统在转播车/电视台当中是怎么串联应用的？
转播车作为一种具有机动灵活、活动范围大等特点的车载小型“电视台”。它可以远离电视台进行现场录像、现场编辑、直播推流工作，并能即时向电视台播控中心传送所录制的节目，进行现场转播。内通系统作为节目制作现场导播、摄像、主持人等岗位之间沟通工具，集成时必不可少，当下转播
2024-12-082024-2025-1 20241301 《计算机基础与程序设计》第十一周学习总结
|这个作业属于哪个课程|2024-2025-1-计算机基础与程序设计||这个作业要求在哪里|2024-2025-1计算机基础与程序设计第一周作业||这个作业的目标|<复习知识，巩固基础>||作业正文|https://www.cnblogs.com/HonJo/p/18593475|一、教材学习内容（一）共用体C语言中的共用体（Union）是一种
2024-12-06flask框架爱团购系统设计与实现毕设源码+论文
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容一、选题背景关于团购系统的研究，现有研究主要集中在大型综合电商平台的团购功能上，如淘宝、美团等平台的团购模式。专门针对特定的爱团购系统的研究
2024-12-04AT_jsc2019_qual_c Cell Inversion
算法场上也是把所有需要的性质全部都推出来了,但是计数类型的底子太差,直接也是没把答案式子表示出来啊容易的,我们可以知道,对于一个长度为\(n\)的序列,其中每一个\([l_i,r_i]\)确定,那么不管怎样排列,最终都是合法的我们还可以知道,如果每一个点,作为左端点还
2024-09-27【基础岛·第6关】OpenCompass 评测 InternLM-1.8B 实践
目录1.概览2.环境配置2.1创建开发机和conda环境2.2安装——面向GPU的环境安装3.数据准备3.1评测数据集3.2InternLM和ceval相关的配置文件4.启动测评4.1使用命令行配置参数法进行评测4.2使用配置文件修改参数法进行评测1.概览在OpenCompass中评估一个模型通常包括
2024-09-14opencompass评测InternLM1.8B
1配置opencompass环境gitclone-b0.2.4https://github.com/open-compass/opencompasspipinstall-e.-ihttps://mirrors.163.com/pypi/simple/pipinstall-rrequirements.txt-ihttps://mirrors.163.com/pypi/simple/pipinstallprotobuf-ihttps://mirrors.163.c
2024-08-01LLM evaluation
TinyEvalhttps://github.com/datawhalechina/tiny-universe/tree/main/content/TinyEvalhttps://huzixia.github.io/2024/05/29/eval/https://meeting.tencent.com/user-center/shared-record-info?id=8b9cf6ca-add6-477b-affe-5b62e2d8f27e&from=3 首先，根据目标数
2024-07-26OpenCompass 评测 InternLM-1.8B 实践
1.进入https://opencompass.org.cn/home，点击在线测评，创建在线测评2.选择internlm2-chat-1.8b模型，与MMLU数据集，开始测评3.查看测评结果
2024-07-16OpenCompass - 大模型评测
文章目录一、关于OpenCompass概览组成评测对象工具架构能力维度设计思路通用能力学科综合能力知识能力推理能力理解能力语言能力安全能力评测方法客观评测主观评测(即将发布)特点路线图
2024-06-10书生·浦语大模型实战营第七节课 OpenCompass 大模型评测实战（内容扩展）
读前感：对这个章节实际上并没有特别多的兴趣，可能在为了评估自己训练的RAG或FT时可以用到。读后感：本章节内容扩展比较多，在教程之外，手把手重新做了一整套的数据集并进行了测试。有兴趣的可以关注一下。学过之后才深刻感受到大模型的测试评估是大模型应用的基础，只未来必不可少
2024-06-09OpenCompass大模型测评实战学习笔记
一、OpenCompass介绍：评测相关：评测意义：研究评测对于我们全面了解大型语言模型的优势和限制至关重要；研究评测有助于指导和改进人类与大型语言模型之间的协同交互；研究评测可以帮助我们更好地规划大型语言模型未来的发展；评测能了解不同语言模型之间的性能、舒适性和安全性，能够帮