首页 > 其他分享 >模型评估与选择

模型评估与选择

时间:2023-09-01 22:22:05浏览次数:39  
标签:采样 frac 交叉 模型 样本 TP 选择 子集 评估

模型评估与选择

数据集划分

留出法:直接将数据集划分为两个互斥集合

K折交叉验证:“交叉验证法”(cross validation)先将数据集D划分为k个大小相似的互斥子集,每个子集D都尽可能保持数据分布的一致性,即从D中通过分层采样得到.然后,每次用k-1个子集的并集作为训练集,余下的那个子集作为测试集;这样就可获得k组训练/测试集,从而可进行k次训练和测试,最终返回的是这k个测试结果的均值.显然,交叉验证法评估结果的稳定性和保真性在很大程度上取决于k的取值,为强调这一点,通常把交叉验证法称为“k折交叉验证”(k-fold crossvalidation).k最常用的取值是10,此时称为10折交叉验证;其他常用的k值有5、20等.图2.2给出了10折交叉验证的示意图

自助法:留出法和交叉验证训练集较小,“自助法”(bootstrapping)是一个比较好的解决方案,它直接以自助采样法(bootstrap sampling)为基础.给定包含m个样本的数据集D,我们对它进行采样产生数据集D':每次随机从D中挑选一个样本,将其拷贝放入D',然后再将该样本放回初始数据集D中,使得该样本在下次采样时仍有可能被采到;这个过程重复执行m次后,我们就得到了包含m个样本的数据集D',这就是自助采样的结果.显然,D中有一部分样本会在D'中多次出现,而另一部分样本不出现.可以做一个简单的估计,样本在m次采样中始终不被采到的概率是$(1-\frac{1}{m})^{m}$,取极限得到

$$
\lim_{m \to \infty}(1-\frac{1}{m})^{2} \to \frac{1}{e} \approx 0.368
$$

性能度量

image

错误率:分类错误的样本数占样本总数比例

精度:分类正确的样本数占样本总数比例

查准率:$\frac{真正例}{真正例+假正例}=\frac{TP}{TP+FP}$

查全率:$\frac{真正例}{真正例+未查出的正例}=\frac{真正例}{真正例+假反例}=\frac{TP}{TP+FN}$

标签:采样,frac,交叉,模型,样本,TP,选择,子集,评估
From: https://www.cnblogs.com/upider/p/model-assessment-and-selection-z1eyisu.html

相关文章

  • 什么是通配符选择器
    通配符选择器是CSS中的一种基本选择器,它使用“*”符号来匹配所有的HTML元素。通配符选择器用于定义针对所有元素的样式规则,它在样式表中的优先级最低,但也为其他选择器增加了特殊的作用。通配符选择器不仅可以匹配整个元素,还可以针对元素的属性进行匹配,因此在排除某些元素样式的同......
  • 选择器的权重
    在CSS中,选择器的权重是一个重要的概念,它决定了哪个样式规则应用于元素。选择器的权重是由一系列因素决定的,包括选择器的类型、选择器的复杂性以及样式规则的来源。选择器的权重有以下规则:内联样式(InlineStyles)的权重最高,为1000。例如:<divstyle="color:red;">。ID选择器的权......
  • COMP 636 BRMM模型算法
    COMP636:PythonAssessmentDue:5pmMonday28August2023Worth40%ofCOMP636gradeSubmitviaAkoraka|LearnIntroductionTheBankside-RakaiaMotorkhanaMavens(BRMM)carclubhasaskedforasystemtohelpmanageitsAugust‘Have-a-goFunMotorkhana’ev......
  • 站长告诉怎么选择网站服务器
    很多站长开始做网站的时候,总是纠结于网站主机的选择。对于是使用服务器还是虚拟主机作为网站空间,往往存在很多困惑,今天为大家详细对比解析一下!选择一个好的空间将有助于网站被搜索引擎更快地编入索引,并继续吸引更多的流量来找到你。所以空间的选择似乎是一件小事,但对于网站推广来说......
  • 使用全套开源工具构建 LLM 应用实战:在 Dify 调用 Baichuan 开源模型能力
    背景在当下开源大语言模型火热的背景下,有很大一部分开发者希望本地部署开源LLM,用于研究LLM或者是基于开源LLM构建自己的LLM应用。笔者也正在尝试通过开源社区的一系列相关优秀项目,通过本地化部署服务来构建自己的LLM应用。那么本地部署一个开源LLM来构建一个聊天应用需......
  • 昨日举办亚马逊云科技re:Inforce大会:数据和模型安全是构建AI应用的关键
     8月31日,亚马逊云科技re:Inforce2023中国站首次登陆中国,在北京盛大开启!此次大会以“AI时代全面智能的安全”为主题,聚焦生成式AI在安全层面给企业带来的挑战与机遇。亚马逊云科技认为,安全是构建生成式AI不可回避的重要议题,企业只有在AI旅程中做好数据、模型和应用的安全防护,才能更......
  • 基于MobileNet的图像分割模型
    整体架构流程数据处理模型构建以及模型训练模型测试IntelOneAPI使用数据处理cityscapes-dataset是一个用于计算机视觉领域的数据集,主要用于场景理解和自动驾驶等任务。该数据集包含来自德国50个城市的街景图像,其中包括高分辨率图像、标注图像和相机参数。标注图像包括像素级别的......
  • 沪汉研习会同期落地,文心大模型赋能高校人才培养
    作为一种新的技术趋势,文心一言等预训练大语言模型的出现与发展,不仅对行业产生了深远影响,也给教育领域带来了前所未有的变革和挑战。高校需要适应新的需求,不断更新课程和教学方法,以培养出能够适应和引领这场技术革命的优秀人才。在此背景下,8月19日,由中国自动化学会主办、华东师范大......
  • 数据安全风险评估
    最早是“信息安全风险评估”,随着信息安全领域的细化,衍生出“数据安全风险评估”。共同目标是保护数据的CIA安全三要素,国标《信息安全技术信息安全风险评估实施指南》中风险评估的流程同样适用于数据安全的风险评估。保密性(Confidentiality):确保信息只能被授权的人或实体访问和......
  • naiveui | select下拉选择自定义选项渲染
    <n-selectv-model:value="selectValue"placeholder="请选择数据":options="sourceOption"clearablefilterable:render-label="renderReportsLabel"......