首页 > 其他分享 >《统计学习方法》第一章

《统计学习方法》第一章

时间:2024-04-11 12:58:36浏览次数:25  
标签:误差 函数 概率模型 模型 第一章 学习 统计 泛化

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录


前言

本文只要记录一些书中的一些小知识点,挑一些本人认为重要的地方进行总结。
可能第一章有些概念不太清楚,到后来具体章节都会慢慢理解的!
各位道友!道长(zhǎng) 道长(chǎng)


一、统计学习分类

1.基本分类

1.1监督学习

标注数据中学习预测模型的机器学习问题,标注数据表示输入输出对应的关系, 预测模型对给定的输入产生相应的输出。
监督学习的本质是学习输入到输出的映射的规律

1.2 无监督学习

无标注数据中学习预测模型的机器学习问题, 预测模型表示数据的类别(聚类),转换(降维)或概率(概率估计)。
无监督学习的本质是学习数据中的统计规律潜在结构

1.3 强化学习

强化学习是指智能系统在与环境的连续互动中学习最优行为策略的机器学习问题。
假设智能系统与环境的互动基于马尔可夫决策过程, 智能系统能观测到的是与环境互动得到的数据序列。
强化学习的本质是学习最优的序贯决策

1.4 半监督学习和主动学习

半监督是有少量标注信息,大量未标注数据
主地学习是找出对学习最有帮助的实例给教师打标签
二者都更接近监督学习

2.模型分类

2.1概率模型与非概率模型

概率模型:决策树、朴素贝叶斯、隐马尔可夫模型、条件随机场、概率潜在语义分析、潜在迪利克雷分配、高斯混合模型
非概率模型:感知机、支持向量机、k近邻、AdaBoost、k均值、建在语义分析、神经网络

2.2线性与非线性

特别是非概率模型,按照是否是线性函数,分为线性和非线性模型

2.3参数化和非参数化模型

参数化模型的维度固定,可以由有限的维参数刻画
非参数化的参数维度不固定或者无穷大

3.算法分类

在线学习:每次接受一个样本进行预测、学习、并不断重复
批量学习:一次接受所有数据,学习后进行预测

有些实际应用场景要求学习必须是在线的

4.技巧分类

4.1贝叶斯分类

在概率模型的学习和推理中,利用贝叶斯定理,计算在给定数据条件下模型的条件概率,即后验概率。
并应用这个原理进行模型的估计、数据预测。

4.2 核方法

核方法可以把线性模型的学习方法例如向量内积计算拓展到非线性模型的学习,使其应用范围更加广泛

二、统计学习方法三要素

          方法=模型+策略+算法

1.模型

监督学习中,模型就是所要学习的条件概率分布或决策函数

2.策略

2.1损失函数和风险函数

损失函数:度量预测错误的程度(非负值)
常见损失函数:
   0-1损失函数
   平方损失函数→(Y-f(X))^2
   绝对损失函数→|(Y-f(X))|
   对数损失函数→-logP(Y|X)
风险函数:平均意义下f(X)关于P(Y|X)的损失
经验风险: 训练集的平均损失
R e m p ( f ) = 1 / N ∑ L ( y i , f ( x i ) ) R_{emp} (f)=1/N \sum L(y_i,f(x_i)) Remp​(f)=1/N∑L(yi​,f(xi​))

2.2经验风险最小化与结构风险最小化

**经验风险最小化(ERM)**策略认为,经验风险最小化的模型就是最优模型
在这里插入图片描述

**结构风险最小化(SRM)**策略认为,为了防止过拟合,在经验风险上加上模型的复杂度的正则化项或罚项
在这里插入图片描述
模型越复杂,J(f)越大,λ实系数,用来权衡经验风险和模型复杂度。

3.算法

学习模型的具体计算方法。

三、模型评估与模型选择

1.训练误差与测试误差

训练误差:模型关于训练数据集的平均损失 R e m p R_{emp} Remp​
测试误差:模型关于测试数据集的平均损失 e t e s t e_{test} etest​

2.过拟合

过拟合:学习选择的模型对已知数据预测的很好,但是对于位置数据预测的很差的现象

四、正则化与交叉验证

这是两种常用模型选择方法

1.正则化

正则化一般有以下形式
在这里插入图片描述
J(f)是正则化项,一般是模型复杂度的单调递增函数,模型越复杂,正则化值越大。
正则化项可以是模型参数向量的范数。
正杂化的作用是选择经验风险与模型复杂度同时较小的模型

2.交叉验证

将数据集分为三部分:训练集、验证集和测试集

五、泛化能力

泛化能力:由该方法学习到的模型对未知数据的预测能力

1.泛化误差

对未知数据的预测误差: R e m p ( f ) = E P [ L ( Y , f ( X ) ) ] R_{emp}(f)=E_P[L(Y,f(X))] Remp​(f)=EP​[L(Y,f(X))]

2.泛化误差上界

学习方法的泛化能力分系往往是通过研究泛化误差的概率上界进行的,简称泛化误差上界。
性质:

  • 它是样本容量的函数,样本容量增加时,泛化上界趋于0;
  • 它是假设空间容量的函数,假设空间容量越大,模型越难学,泛化误差上界越大

六、生成模型与判别模型

分别是生成方法和判别方法所学到的模型

七、监督学习应用

1.分类问题

分类器在测试数据集的预测正确或不正确,四种情况出现的总数分别记作:

在这里插入图片描述
评价指标是精准率和召回率
精确率:
在这里插入图片描述
召回率:
在这里插入图片描述
F1值:
在这里插入图片描述

2.标注问题

输入是一个观测序列,输出是一个标记序列或状态序列。
评价指标和分类模型一致

3.回归问题

用于预测输入变量和输出变量之间的关系。
回归问题的学习等价与函数拟合:选择一条函数曲线使其很好的拟合已知数据且很好的预测未知数据。

总结

今天的内容是统计学习方法的概论,没什么难理解的公式,都是些笼统的术语。

标签:误差,函数,概率模型,模型,第一章,学习,统计,泛化
From: https://blog.csdn.net/weixin_46034279/article/details/137632585

相关文章

  • Java程序设计教程(第九版)第一章计算机系统概述
    目录本章目标1.1计算机处理过程硬件软件数字计算机模拟技术数字技术二进制数1.2硬件组件计算机结构输入/输出设备主存储器和辅助存储器中央处理器本章目标软硬件关系软件类型及用法核心硬件及作用硬件如何协同执行程序、管理数据如何共享信息初解Java程序编......
  • 从零开始学习C语言 第一篇如何学习C语言
    想必大家和我一样,都是在B站上大学,或者报一些网课,我自己学习下来发现“鹏哥C语言”(B站上搜鹏哥C语言)是一个很不错的网课,里面有专属于你的问答群,四五个老师服务你一个人,并且有问必答,除了编程方面的,学习、生活方面的问题都可以和他们沟通,他们会像长者一样毫无保留地为你传道授业解......
  • 机器学习—特征工程(三)
    什么是特征工程特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。意义︰会直接影响机器学习的效果特征工程的位置与数据处理的比较pandas:—个数据读取非常方便以及基本的处理格式的工具sklearn:对于特征的处理提供了强大的接......
  • 机器学习—无量纲化和降维(四)
    什么是特征预处理?通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程1包含内容数值型数据的无量纲化:归一化标准化2特征预处理APIsklearn.preprocessing为什么要进行归一化or标准化?特征的单位或者大小相差较大,或者某特征的方差相比其他的特征......
  • markdown学习(基础语法)
    Markdown学习标题三级标题四级标题字体字体斜体字体加粗字体斜体加粗划线字体引用一个向右箭头用于引用分割线三个-符号:三个*符号:图片超链接点击跳转到力扣列表abcabc表格右键插入即可代码javac++c#......
  • Markdown学习Day01
    MarkDown学习标题两个#号加空格加内容三级标题三个#号加空格加内容四级标题四个#号加空格加内容最多类推到六级标题字体HelloHello头尾双*加粗Hello头尾单*斜体Hello头尾三*斜体加粗Hello头尾双~删除线引用拥抱美好新生活引用=>符号加空格分割线三......
  • 学习Source Generators之打包成Nuget使用
    前面我们简单的实现了一个从swagger生成实体类的Generator,在实际使用中,通过nuget包引用使用会更方便,那么本篇文章将介绍如何将Generator打包成Nuget来使用。打包Nuget这里我们将GenerateClassFromSwagger.Analysis打包成Nuget进行使用。首先需要修改项目文件。修改项目文件在......
  • 深度学习-nlp-循环神经网络RNN--69
    目录1.概述2.RNN的模型参考:https://zhuanlan.zhihu.com/p/308449051.概述输出会反馈到输入的神经网络:循环神经网络(RecurrentNeuralNetworks,以下简称RNN),它广泛的用于自然语言处理中的语音识别,手写书别以及机器翻译等领域。在前面讲到的DNN和CNN中,训练样本的输入和输出......
  • org.apache.commons.lang3.ArrayUtils 学习笔记
    1234567891011121314151617181920212223242526272829303132333435package com.nihaorz.model; /** *@作者王睿 *@时间2016-5-17上午10:05:17 * */public class Person{    private Stringid;    pr......
  • 数据是一维数据,利用tensorflow深度学习框架,写一个带自注意力机制的卷积神经网络,并进行
    下面是一个使用TensorFlow框架的带有自注意力机制的卷积神经网络(Self-AttentionConvolutionalNeuralNetwork)的示例代码,包括数据处理、模型定义和训练过程:importtensorflowastffromtensorflow.keras.layersimportConv1D,Dense,GlobalMaxPooling1D,Concatenate#......