首页 > 其他分享 >1.2 监督学习

1.2 监督学习

时间:2024-10-05 13:18:52浏览次数:10  
标签:输出 1.2 模型 学习 监督 空间 输入


前言:

我往后看了看这本书,发现很多机器学习的术语定义出现,我推测这门课是机器学习的先修课程,有趣的是我们学校在上机器学习之前没有上过这门课,怪不得看的时候云里雾里,因此我觉得改变计划,把接下来的重心放到统计学习方法上来。


1.2 监督学习

在统计学习中,学习方法主要包括监督学习、非监督学习、半监督学习以及强化学习。本书的重点是讨论监督学习问题。

1.2.1 监督学习概述

监督学习的任务是通过学习一个模型,使得该模型能够对任意给定的输入,给出相应的输出预测。需要注意的是,这里的输入和输出是指被学习系统处理的输入和输出,而不是学习过程中的输入与输出。监督学习作为统计学习的一个重要分支,内容丰富且应用广泛,是计算机操作的基础——从输入到输出的映射。

1.2.2 关键概念
1. 输入空间、特征空间与输出空间

在监督学习中,输入空间(input space)和输出空间(output space)是分别包含所有可能输入和输出值的集合。它们可以是有限集合,也可以是整个欧氏空间。输入和输出空间可以相同,也可以不同,但通常情况下输出空间远小于输入空间。

每一个具体的输入称为一个实例(instance),通常用特征向量(feature vector)表示。所有特征向量所在的空间称为特征空间(feature space),特征空间的每一维度对应一个特征。有时我们假设输入空间与特征空间相同,不做区分;有时也会假设它们不同,模型定义在特征空间上,而实例是从输入空间映射到特征空间的。

在监督学习中,输入和输出被视为在输入(特征)空间和输出空间上定义的随机变量。输入变量通常用大写字母 XXX 表示,输出变量用 YYY 表示;它们的取值分别用小写字母 xxx 和 yyy 表示。输入变量 xxx 通常为特征向量:

其中 xix_ixi​ 表示 xxx 的第 iii 个特征。

监督学习的模型从训练数据(由输入和输出对组成的样本集合)中学习,测试数据则用来评估模型的预测能力。训练集通常表示为:

输入变量和输出变量的类型可能是连续的,也可能是离散的,根据不同情况,预测任务有不同的名称:输入和输出均为连续变量的任务称为回归问题,输出为离散变量的任务称为分类问题

2. 联合概率分布

监督学习假设输入和输出的随机变量 XXX 和 YYY 遵循联合概率分布 P(X,Y)P(X, Y)P(X,Y),表示输入和输出的联合分布。在学习过程中,假定这一联合概率分布存在,但对学习系统来说,它的具体形式是未知的。训练数据和测试数据被看作是根据联合概率分布 P(X,Y)P(X, Y)P(X,Y) 独立同分布生成的。

3. 假设空间

监督学习的目标是找到从输入到输出的最佳映射,该映射由模型表示。模型属于从输入空间到输出空间的映射集合,这个集合称为假设空间(hypothesis space)。确定假设空间意味着确定了学习的范围。

监督学习中的模型可以是概率模型,也可以是非概率模型,分别由条件概率分布 P(Y∣X)P(Y|X)P(Y∣X) 或决策函数 Y=f(X)Y = f(X)Y=f(X) 来表示。当给定一个具体输入时,模型的输出预测可以写作 P(Y∣x)P(Y|x)P(Y∣x) 或 y=f(x)y = f(x)y=f(x)。

 

1.2.2 问题的形式化

在监督学习中,核心任务是利用训练数据集学习一个模型,并通过这个模型对测试样本进行预测。由于训练数据集是由人工标注的输入与输出组成的,因此称为监督学习。监督学习可以分为两个阶段:学习阶段预测阶段,这两个过程分别由学习系统和预测系统来完成。监督学习的过程可以用图 1.1 来描述。

 (x1, y1), (x2, y2), ..., (xN, yN)
 ───────────────────────────▶  学习系统 ───▶ 模型 ───▶ 预测系统 ───▶ (x_test, y_test)

图 1.1 监督学习问题示意图

1.2.2.1 训练数据集的表示

监督学习首先会给定一个训练数据集 TTT,通常表示为:

其中,(xi,yi)(x_i, y_i)(xi​,yi​),i=1,2,...,Ni = 1, 2, ..., Ni=1,2,...,N,称为样本样本点。在这个表示中,xi∈X⊆Rdx_i \in \mathcal{X} \subseteq \mathbb{R}^dxi​∈X⊆Rd 是输入的观测值(也称为输入或实例),而 yi∈Y⊆Ry_i \in \mathcal{Y} \subseteq \mathbb{R}yi​∈Y⊆R 是输出的观测值(也称为输出)。输入空间 X\mathcal{X}X 通常是一个多维欧氏空间,而输出空间 Y\mathcal{Y}Y 则根据具体任务有所不同,可以是离散的或连续的值。

1.2.2.2 联合概率分布假设

在监督学习中,我们假设训练数据和测试数据是依联合概率分布 P(X,Y)P(X, Y)P(X,Y) 独立同分布产生的。这一假设使得我们可以基于训练数据进行学习,并期望所学到的模型可以推广到未见过的测试数据。

1.2.2.3 学习系统

学习系统的任务是通过给定的训练数据集 TTT,学习到一个能够描述输入与输出之间映射关系的模型。这个模型可以是:

  • 条件概率分布: P(Y∣X)
  • 决策函数: Y=f(X)

条件概率分布 P(Y∣X) 或决策函数 Y=f(X) 描述了输入变量 X 和输出变量 Y 之间的映射关系。

1.2.2.4 预测系统

在预测阶段,预测系统利用学习阶段得到的模型,对新的测试样本集进行预测。对于给定的测试样本输入 xtestx_{\text{test}}xtest​,模型将输出相应的预测值 y^\hat{y}y^​,即:

或通过条件概率分布给出:

通过这些预测,系统能够对测试数据进行相应的判断或决策。

1.2.2.5 模型的优化与推广

在学习过程中,学习系统(即学习算法)通过训练数据集中提供的信息来优化模型。具体来说,学习系统试图使得模型的预测输出 f(x)f(x)f(x) 与训练数据集中实际输出 yyy 之间的差距尽可能小。为了保证模型不仅在训练数据上表现良好,还能够推广到未知的测试数据集,学习系统需要通过多次尝试,选择最优的模型,以便在测试数据上获得良好的预测效果。

 

标签:输出,1.2,模型,学习,监督,空间,输入
From: https://blog.csdn.net/tang7mj/article/details/142704543

相关文章

  • 「分数规划」学习笔记及做题记录
    「分数规划」学习笔记及做题记录做题时发现不会分数规划,赶紧来学一下。分数规划用于求解下面一类问题:有\(n\)个物品,第\(i\)个物品的价值为\(a_i\),费用为\(b_i\)。从中选择若干个物品,使得价值与费用的比值\(\dfrac{\suma}{\sumb}\)最大/最小。另一种更严谨的表示方......
  • 机器学习专业词汇:“Lookahead horizon” 可以翻译为“前瞻视距”或“预见范围”
    “Lookaheadhorizon”可以翻译为“前瞻视距”或“预见范围”。在不同领域中,它可能具有稍微不同的含义:在机器学习和人工智能中,尤其是强化学习领域,“lookaheadhorizon”是指一个智能体在决策时考虑未来多少步的可能结果。换句话说,就是在进行某个操作之前,智能体会评估多少步之......
  • 【AI学习】Mamba学习(二):线性注意力
    上一篇《Mamba学习(一):总体架构》提到,Transformer模型的主要缺点是:自注意力机制的计算量会随着上下文长度的增加呈平方级增长。所以,许多次二次时间架构(指一个函数或算法的增长速度小于二次函数,但大于线性函数),如线性注意力、门控卷积和循环模型,以及结构化状态空间模型(SSM)被......
  • 《深度学习》OpenCV 背景建模 原理及案例解析
    目录一、背景建模1、什么是背景建模2、背景建模的方法    1)帧差法(backgroundSubtractor)    2)基于K近邻的背景/前景分割算法BackgroundSubtractorKNN    3)基于高斯混合的背景/前景分割算法BackgroundSubtractorMOG23、步骤    1)初始......
  • 《深度学习》OpenCV 指纹验证、识别
    目录一、指纹验证1、什么是指纹验证2、步骤1)图像采集2)图像预处理3)特征提取4)特征匹配5)相似度比较6)结果输出二、案例实现1、完整代码2、实现结果调试模式:三、指纹识别案例1、展示指纹库图片2、待验证指纹图3、看完整代码运行结果:一、指纹验证1、什么是指纹......
  • Indexing, Selecting & Assigning(pandas学习二)
    Nativeaccessors(原生访问器)原生Python对象为索引数据提供了很好的方法。Pandas继承了所有这些方法,这有助于轻松上手。考虑这个DataFramereviews输出如下(未截全):在Python中,我们可以通过将对象作为属性访问来访问它的属性。例如,book对象可能有一个title属性,我们可......
  • JVM学习【一】
    前言以下内容是经过我记忆并添加自己理解所写,可能会出现概念上的错误或者用词不当,请各位大佬批评指正。什么是JVMJVM是Java VirtualMachine,译为java虚拟机,是一台虚构出来的计算机,是一种规范。所以这也意味着JVM不止一种,只要满足JVM规范,任何企业,组织和个人都可以开发自己专......
  • 安装Kali2021.1步骤(VMware16.1.2)
    脑子空空关注IP属地:上海2022.06.0417:47:41字数159阅读991 1、VMware虚拟机的下载安装都在官网,这里用的是16.1.2的版本2、Kali下载(选择VirtualMachines)  3、点击VMware64下方的下载图标(文件大小只有2G,网速快的话10-15分钟就下载完了)  4......
  • 学习笔记 - log
    目录1.定义2.性质3.计算公式本人实力不济,如有错误或建议及补充,请指出(评论或私信都行)1.定义如果\(x^n=a\),那么\(n\)叫作以\(x\)为底\(a\)的对数。记作\(n=\log_xa(x>0\text{且}x\neq1)\)。2.性质\(\log_aa^x=x\)(定义)\(\log_a1=0(a^0=1)\)\(\log_aa=1(a^1=a)\)负数......
  • Markdown学习
    一、学习Markdown格式掌握内容:使用#来表示不同级别的标题;使用数字加点标记有序列表;使用|和-创建表格;使用三个或以上的-或*标记水平线未掌握内容:使用-,*,或+标记无序列表;使用*或_进行斜体或粗体;使用语法添加图片;使用`(单个反引号)表示行内代码,使用三个反引号表示代......