首页 > 其他分享 >[模式识别复习笔记] 第1-2章 基本概念

[模式识别复习笔记] 第1-2章 基本概念

时间:2024-06-19 23:13:19浏览次数:18  
标签:泛化 训练 模式识别 能力 分类器 集上 基本概念 复习

1. 模式识别系统的各个设计环节

  • 模式采集:借助物理设备(传感器、摄像头)进行数据的采集和存储。

  • 预处理:数据清洗、降噪,增强数据中有用的信息。

  • 特征提取:提取数据中对识别有用的特征。

  • 分类器学习:根据训练数据特点,选择何时的分类器模型,利用训练集学习得到参数。


2. 模式识别相关概念

  • 目标:寻找一种区分不同类的模式的“方法”,称为“分类方法”。给定一个新的模式,利用找到的分类方法将其分配给最接近的模式类。

  • 思想:从过去的经验中学习。

  • 训练集:搜集历史数据,用于观察数据中的规律。

  • 特征提取:找出一种新的数据表示方法,使得规律易被发现。

  • 分类器学习:学习规律的过程。

  • 分类器:从训练集中学习到的规律的体现。

  • 测试集:评估学习的规律而搜集的数据(通常和训练集不重合)。

  • 预测:将规律应用到新模式上,得到预测结果。


3. 欠拟合、过拟合、泛化能力

欠拟合:模型复杂度过低或者训练数据特征过少,模型在训练集上就表现很差,不能对训练集中的实例进行正确分类,导致分类器泛化能力降低。

过拟合:模型复杂度过高,导致学习到了一些无用的特征,模型在训练集上的表现很好,但由于过分追求降低训练误差,导致分类器泛化能力降低。

泛化能力:训练好的分类器对 不在训练集中的新实例 正确分类的能力。

PS:泛化能力一般难以直接度量,通常会构建一个测试集,用分类器在测试集上的分类性能近似表示其泛化能力。

  • 一个在训练集上取得好性能的分类器 不一定 具有好的泛化能力

  • 一个在训练集上表现比较差的分类器 不可能 具有好的泛化能力。


4. 如何提高分类器的泛化性能

  • 构建更好的训练数据集(数量多、多样性、无噪声、类别分布均衡)。

  • 提高/降低模型的复杂度。

标签:泛化,训练,模式识别,能力,分类器,集上,基本概念,复习
From: https://www.cnblogs.com/MarisaMagic/p/18257706

相关文章

  • [模式识别复习笔记] 第3章 线性判别函数
    1.线性判别函数1.1定义在\(d\)维特征空间中,有线性判别函数:\[G(x)=w^{\text{T}}x+b\]其中,\(w=[w_1,w_2,\ldots,w_d]^T\)称为权值向量,\(b\)称为偏置,都是需要学习的参数。\(G(x)=0\)为决策边界方程。PS:只能解决二分类问题。1.2几何意义\(w\)为超......
  • [模式识别复习笔记] 第4章 SVM
    1.SVM简介1.1SVM支持向量机给定如图所示的线性可分训练集,能够将两类样本正确分开的直线很多。感知机算法可以找到一条直线,且找到的直线不唯一。然而感知机无法确定哪一条直线最优,但是\(\text{SVM}\)可以。\(\text{SVM}\)可以找到能够将训练样本正确分类的直线中具有......
  • C语言期末复习笔记
    目录一,基础介绍。二,标识符起名规范。三,数据类型。四,变量。五,运算符和表达式1,加减乘除​编辑  /为整除,%为余数,*为乘号2,关系运算符3,逻辑运算符4,运算符优先级5,前自增,后自增6,三目运算符。7,符合运算符。六,控制语句。1,if判断2,多重判断。3,for循环4,while循环5,d......
  • Javascript入门博客【入门复习(学习)使用】
    JavaScript是一门高级,解释形语言,大量用于关于web网站的开发,可以和网页联动做出更多有趣的动画效果。其运行方式大都是嵌入在网页中运行。其实在定义方面如果过你是初学者来学习和这方面相关的知识,知道上面这些就已经足够了。我们可以在浏览器中直接进行对代码的控制,进入浏览器......
  • JAVA复习_PTA_判断题_汇总
    在Java中,方法重写(Override)是子类对父类允许方位的方法的实现过程进行重新编写,其参数列表一定不能修改,异常、访问限制和返回值类型能够进行修改。FJava中,final关键字修饰的类成员方法,不能被子类重写。TJava中,接口中的成员变量可用abstract关键字修饰。FJava中,接口中的成......
  • 【笔记】概率论复习
    常用分布列名称分布列/密度函数期望方差二项分布\(B(n,p)\)\(P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}\)\(np\)\(np(1-p)\)超几何分布\(nM/N\)几何分布\(P(X=k)=(1-p)^kp\)\(\frac{1}{p}\)\(\frac{1-p}{p^2}\)负二项分布Poisson分布\(\operator......
  • 机器学习课程复习——朴素贝叶斯
    1.定义是一种基于贝叶斯定理与特征条件独立假设的生成式分类方法。2.公式原版公式简化版公式由于上述公式无法计算,引入条件独立假设条件独立版公式3.贝叶斯分类器由上述公式可得贝叶斯分类器化简为4.参数估计4.1.极大似然估计4.2.学习与分类算法4.2......
  • 【计算机网络】第四章.网络层 网络层超硬核复习好物(1),考前必看!!
    ......
  • 复习数据结构的第八天(串)
    串的概念字符串的概念很简单,就是一堆字符形成的有限序列。比如"看到这里的都是帅哥","abcdef"等都是字符串。而字符串字符的个数就是字符串的长度。通常一个字符串的结束标识是'\0'。对串的操作通常都是针对子串进行的,子串可以理解为就是一个字符串的子集,比如"帅哥"就是"看到......
  • 什么是大模型?一文读懂大模型的基本概念
    大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的基本概念出发,对大模型领域容易混淆的相关概念进行区分,并就大模型的发展历程、特点和分类、泛化与微调进行了详细解读,供大家在了解大模型基本知识的过程中起到一定参考作用。本文目录如下:·大模型的......