诸论及模型评估与选择

基本术语

数据集（data set）

实例（instance）、样本（sample）:每条记录是关于一个事件或者要给对象的描述

属性（attribute）、特征（feature）：反映事件或对象在某方面的表现或性质的事项

属性值（attribute value）：属性上的取值

属性空间（attribute space）、样本空间（sample space）、输入空间：以样本的属性为坐标轴张成的多维空间

特征向量（feature vector)）：属性空间内每个点对应的一个坐标向量

从数据中学得模型的过程称为"学习" (learning) 或"训练" (training)

样例（example）：拥有了标记信息的示例

分类：欲预测的是离散值

回归:欲预测的是连续值

二分类任务：正类负类

聚类：物以类聚，人以群分

监督学习：分类和回归

无监督学习：聚类（训练机器使用既未分类也未标记的数据的方法）

泛化：模型适用于新样本的能力

演绎：从基础原理推演出具体状况

归纳：从具体的事实归结出一般性规律

假设空间：可以生成的所有函数的集合

机械学习（死记硬背式学习）：把外界输入的信息全部记录下来，在需要时原封不动地取出来使用

归纳学习（从样例中学习）：从训练样例中归纳出学习结果

模型评估与选择

经验误差与过拟合

过拟合：巳经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质，这样就会导致泛化性能下

欠拟合：指对训练样本的一般性质尚未学好

模型选择：对候选模型的泛化误差进行评估然后选择泛化误差最小的那个模型

评估方法

留出法

直接将数据集发分为两个互斥的集合，其中一个做训练集，一个做测试集

⚠️ 训练/测试集的划分要尽可能保持数据分布的一致性，避免因数据划分过程引入额外的偏差而对最终结果产生影响

⚠️因为原始数据集存在多种分割划分方式，所以不同的划分将导致模型评估的结果也会有误差，单次使用留出法得到的估计结果往往不够稳定可靠

标签：frac,macro,模型,TP,times,诸论,micro,评估
From： https://www.cnblogs.com/hywasd/p/17058783.html

网络分层，网络协议TCP/IP模型，OSI模型
TCP\IP模型是多种协议的综合，4层模型（也有说5层的）。其中最重要的就是分层结构和主要协议。1.应用层（SMTP,HTTP,FTP）2.传输层（TCP,UDP）3.网络互联层（IPv4,IPv6）4.网络接口层（链路层）应......
软件工程：7.生存周期过程和软件生存周期模型
软件生存周期软件生存周期(softwarelifecircle)又称软件生命期，生存期。它是指从形成软件开发概念开始，到软件投入使用，再到软件失去价值而消亡的整个过程。软件生存周期过程......
自动化测试模型
概念自动化测试模型可以看作自动化测试框架与工具设计的思想。自动化测试不仅仅是单纯写写脚本运行就可以了，还需要考虑到如何使脚本运行效率提高，代码复用、参数化等问题。......
【论文写作分析】之四《基于ALBERT-TextCNN模型的多标签医疗文本分类方法》
论文名称：《基于ALBERT-TextCNN模型的多标签医疗文本分类方法》发布期刊：《山东大学学报(理学版)》期刊信息：CSCD 论文写作分析摘要：本文非常简单。网络模型是直......
【推荐系统】POLY2、FM、FFM模型的进化之路
文章目录POLY2模型FM模型FFM模型POLY2模型逻辑回归模型是CTR预测领域较为广泛使用的模型，原因有模型具备可解释性，良好的数学解释性，可以实现并行化提......
sklearn 多种模型的学习曲线拟合中的特性与运行速度（机器学习）
......
机器学习：聚类算法与无监督学习、模型评估标准
......
【推荐系统】Facebook经典模型GBDT+LR代码实践
如果需要完整代码可以关注下方公众号，后台回复“代码”即可获取，阿光期待着您的光临~文章目录一、导库二、处理数据三、构建LR模型四、构建GBDT......
【推荐系统】隐语义模型(LFD)与矩阵分解(Matrix Factorization)
如果需要完整代码可以关注下方公众号，后台回复“代码”即可获取，阿光期待着您的光临~文章目录1.隐语义模型与矩阵分解2.隐语义模型（LatentFactorModel）3.......
网络流之广义切糕模型
问题有\(n\)个整数变量\(x_i\)。\(x_i\)可以取\([1,m]\)，取\(j\)需要\(a_{i,j}\)的代价。有若干个约束，形如\(x_{u_i}\lex_{v_i}+w_i\)。给变量赋值，最小化总......

诸论与模型评估与选择

诸论及模型评估与选择

基本术语

模型评估与选择

经验误差与过拟合

评估方法

留出法

相关文章

赞助商

阅读排行