模型评估与选择

数据集划分

留出法：直接将数据集划分为两个互斥集合

K折交叉验证：“交叉验证法”(cross validation)先将数据集D划分为k个大小相似的互斥子集,每个子集D都尽可能保持数据分布的一致性,即从D中通过分层采样得到.然后，每次用k-1个子集的并集作为训练集,余下的那个子集作为测试集;这样就可获得k组训练/测试集,从而可进行k次训练和测试,最终返回的是这k个测试结果的均值.显然,交叉验证法评估结果的稳定性和保真性在很大程度上取决于k的取值,为强调这一点,通常把交叉验证法称为“k折交叉验证”(k-fold crossvalidation).k最常用的取值是10,此时称为10折交叉验证;其他常用的k值有5、20等.图2.2给出了10折交叉验证的示意图

自助法：留出法和交叉验证训练集较小，“自助法”(bootstrapping)是一个比较好的解决方案,它直接以自助采样法(bootstrap sampling)为基础.给定包含m个样本的数据集D，我们对它进行采样产生数据集D':每次随机从D中挑选一个样本,将其拷贝放入D',然后再将该样本放回初始数据集D中,使得该样本在下次采样时仍有可能被采到;这个过程重复执行m次后,我们就得到了包含m个样本的数据集D'，这就是自助采样的结果.显然,D中有一部分样本会在D'中多次出现,而另一部分样本不出现.可以做一个简单的估计,样本在m次采样中始终不被采到的概率是$(1-\frac{1}{m})^{m}$,取极限得到

$$
\lim_{m \to \infty}(1-\frac{1}{m})^{2} \to \frac{1}{e} \approx 0.368
$$

性能度量

错误率：分类错误的样本数占样本总数比例

精度：分类正确的样本数占样本总数比例

查准率：$\frac{真正例}{真正例+假正例}=\frac{TP}{TP+FP}$

查全率：$\frac{真正例}{真正例+未查出的正例}=\frac{真正例}{真正例+假反例}=\frac{TP}{TP+FN}$

‍

标签：采样,frac,交叉,模型,样本,TP,选择,子集,评估
From： https://www.cnblogs.com/upider/p/model-assessment-and-selection-z1eyisu.html

什么是通配符选择器
通配符选择器是CSS中的一种基本选择器，它使用“*”符号来匹配所有的HTML元素。通配符选择器用于定义针对所有元素的样式规则，它在样式表中的优先级最低，但也为其他选择器增加了特殊的作用。通配符选择器不仅可以匹配整个元素，还可以针对元素的属性进行匹配，因此在排除某些元素样式的同......
选择器的权重
在CSS中，选择器的权重是一个重要的概念，它决定了哪个样式规则应用于元素。选择器的权重是由一系列因素决定的，包括选择器的类型、选择器的复杂性以及样式规则的来源。选择器的权重有以下规则：内联样式（InlineStyles）的权重最高，为1000。例如：<divstyle="color:red;">。ID选择器的权......
COMP 636 BRMM模型算法
COMP636:PythonAssessmentDue:5pmMonday28August2023Worth40%ofCOMP636gradeSubmitviaAkoraka|LearnIntroductionTheBankside-RakaiaMotorkhanaMavens(BRMM)carclubhasaskedforasystemtohelpmanageitsAugust‘Have-a-goFunMotorkhana’ev......
站长告诉怎么选择网站服务器
很多站长开始做网站的时候，总是纠结于网站主机的选择。对于是使用服务器还是虚拟主机作为网站空间，往往存在很多困惑，今天为大家详细对比解析一下！选择一个好的空间将有助于网站被搜索引擎更快地编入索引，并继续吸引更多的流量来找到你。所以空间的选择似乎是一件小事，但对于网站推广来说......
使用全套开源工具构建 LLM 应用实战：在 Dify 调用 Baichuan 开源模型能力
背景在当下开源大语言模型火热的背景下，有很大一部分开发者希望本地部署开源LLM，用于研究LLM或者是基于开源LLM构建自己的LLM应用。笔者也正在尝试通过开源社区的一系列相关优秀项目，通过本地化部署服务来构建自己的LLM应用。那么本地部署一个开源LLM来构建一个聊天应用需......
昨日举办亚马逊云科技re:Inforce大会：数据和模型安全是构建AI应用的关键
8月31日，亚马逊云科技re:Inforce2023中国站首次登陆中国，在北京盛大开启！此次大会以“AI时代全面智能的安全”为主题，聚焦生成式AI在安全层面给企业带来的挑战与机遇。亚马逊云科技认为，安全是构建生成式AI不可回避的重要议题，企业只有在AI旅程中做好数据、模型和应用的安全防护，才能更......
基于MobileNet的图像分割模型
整体架构流程数据处理模型构建以及模型训练模型测试IntelOneAPI使用数据处理cityscapes-dataset是一个用于计算机视觉领域的数据集，主要用于场景理解和自动驾驶等任务。该数据集包含来自德国50个城市的街景图像，其中包括高分辨率图像、标注图像和相机参数。标注图像包括像素级别的......
沪汉研习会同期落地，文心大模型赋能高校人才培养
作为一种新的技术趋势，文心一言等预训练大语言模型的出现与发展，不仅对行业产生了深远影响，也给教育领域带来了前所未有的变革和挑战。高校需要适应新的需求，不断更新课程和教学方法，以培养出能够适应和引领这场技术革命的优秀人才。在此背景下，8月19日，由中国自动化学会主办、华东师范大......
数据安全风险评估
最早是“信息安全风险评估”，随着信息安全领域的细化，衍生出“数据安全风险评估”。共同目标是保护数据的CIA安全三要素，国标《信息安全技术信息安全风险评估实施指南》中风险评估的流程同样适用于数据安全的风险评估。保密性（Confidentiality）：确保信息只能被授权的人或实体访问和......
naiveui | select下拉选择自定义选项渲染
<n-selectv-model:value="selectValue"placeholder="请选择数据":options="sourceOption"clearablefilterable:render-label="renderReportsLabel"......

模型评估与选择

模型评估与选择

数据集划分

性能度量

相关文章

赞助商

阅读排行