首页 > 其他分享 >机器学习基础-统计学习-SLT

机器学习基础-统计学习-SLT

时间:2023-06-23 10:33:57浏览次数:36  
标签:机器 泛化 SLT 间隔 学习 Vapnik


机器学习基础-统计学习-SLT_泛化

    万普尼克(Vapnik)建立的一套机器学习理论,使用统计的方法,因此有别于归纳学习等其它机器学习方法。由这套理论所引出的支持向量机对机器学习的理论界以及各个应用领域都有极大的贡献,一般情况下弗拉基米尔-万普尼克理论是香农实验室奠基资料和自身的数学背景。

     目前理论分析方面有间隔(Margin)和损失()函数两种观点。1992年到2004年期间,V-Vapnik研究处于间隔时代,在L-Valiant提出的概率近似正确理论(Probably Approximately Correct,PCA),基于VC维(Vapnik-Chervonekis)的模型泛化能力的概率近似正确的上界,1998年肖—泰勒(Shawe -taylor)发现了量化模型泛化能力的间隔界限,此时基于间隔的算法得到了认可,学习所获得间隔越大泛化能力也就越强。间隔是泛化能力的指标,通常的间隔是有实际物理意义,一般认为是几何间隔和几何距离,线性可分的情况下是样本Margin是该点到分类平面的欧式距离,样本集合叫分类器,指样本点间隔中的最小者。

    bshq:机器学习基础-《统计学习-SLT》教材分享

    推荐一本伊利诺伊大学香槟分校电气与计算机工程系和协调科学实验室的Bruce Hajek和 Maxim Raginsky编写的《统计学习-SLT》教材。

本书目录

机器学习基础-统计学习-SLT_人工智能_02

机器学习基础-统计学习-SLT_人工智能_03

机器学习基础-统计学习-SLT_泛化_04

本书内容节选

机器学习基础-统计学习-SLT_人工智能_05

机器学习基础-统计学习-SLT_自然语言处理_06

机器学习基础-统计学习-SLT_自然语言处理_07

机器学习基础-统计学习-SLT_机器学习_08


标签:机器,泛化,SLT,间隔,学习,Vapnik
From: https://blog.51cto.com/u_13046751/6537325

相关文章

  • 2021年机器学习面试核心知识点中文版整理分享
        本资源主要是为了整理机器学习面试相关知识点的有用链接(注:目前不打算将一些基础算法的内容加入这个repo里,比如LR、SVM算法在《统计学习方法》里已经得到了很好的解释,面试时可能考到的手推公式在书里已经写的很好了,所以推荐直接看书即可)    资源整理自网络,源地址:https:......
  • 深度学习推荐系统、CTR预估工业界实战论文整理分享
        本资源整理了深度学习在推荐系统、广告系统中应用的一些经典论文,涉及推荐系统中召回、排序、CTR预估、Embedding化、系统多样性、多目标,排序和混排的EE和RL等部分。    资源整理自网络,源链接:https://github.com/imsheridan/DeepRec 目录    点击率预估    召......
  • 中文版-可解释的机器学习-黑盒模型可解释性理解指南
        本书向你介绍了如何使(监督)机器学习模型可解释。虽然本书中包含⼀些数学公式,但是即使没有公式,你也需要能够理解这些⽅法背后的思想。本书不适合机器学习初学者。如果你不熟悉机器学习,则有很多书籍和其他资源可以学习基础知识。关于机器学习的⼊门学习,我推荐在线学习平台......
  • 2020年新书速递-《因果推理原理:基础与学习算法》分享
            推荐一本详细讲解因果推理原理的新书,本书2020年初刚刚Release出来,需要的朋友自取。对该领域理解有限,翻译不太准确,望见谅。     文末附本书下载pdf地址。 前沿概述    因果关系推理(Causality)是一个非常有趣的研究课题。最近才开始研究隐藏在其背后的数学......
  • 深度强化学习必读-决策算法综述
    本书介绍    本书广泛介绍了不确定条件下最优决策的算法。涵盖了与决策相关的各种主题,介绍了基本的数学问题公式和解决它们的算法。提供图形、例子和练习来介绍各种方法背后的几本原理。本书是为高级本科生和研究生以及专业人士准备的。这本书需要一些数学知识,并假设之前接触过......
  • 机器学习-可解释机器学习局限性
        本书讲解了当前可解释机器学习方法中存在的局限性。这些方法包括partialdependenceplots(PDP)、累积局部效应(AccumulatedLocalEffects,ALE)、排列特征重要性、leave-one-covariateout(LOCO)和局部可解释模型不可知解释(LIME)。所有这些方法都可以用来解释经过训练的机器学习模......
  • 轻量级的深度学习框架Tinygrad
    Tinygrad是一个轻量级的深度学习库,它提供了一种简化和直观的方法来理解和实现神经网络。在本文中,我们将探讨Tinygrad及其主要功能,以及它如何成为那些开始深度学习之旅的人的有价值的工具。 https://avoid.overfit.cn/post/33edc61f5a414cefa4431bf8dd904b24......
  • Java学习-集合篇
    集合什么是集合?有什么用?数组其实就是一个集合。集合实际上就是一个容器。可以来容纳其他类型的数据。集合为什么说在开发中使用的较多?集合是一个容器,是一个载体,可以依次容纳多个对象。在实际的开发中,假设连接数据库,数据库当中有10条记录,那么假设把这10条记录查询出来,在java程......
  • [QML]事无巨细开始实践QML开发(一)什么是QML,为什么学习QML,先写一个简单的页面
    [QML]从零开始QML开发(一)什么是QML,为什么学习QML,先写一个简单的页面QML开发和QWidget开发的区别QML(QtMeta-ObjectLanguage)是Qt提供的一种声明性语言,用于快速创建用户界面。相对而言,QtWidgets是基于C++的桌面应用程序开发框架。下面是QML和QtWidgets之间的一些优缺点以及为何......
  • 【深度学习】参数量、模型大小、显存
    对于一个深度学习神经网络来说,其通常包含很多卷积层,用于不断提取目标的特征,或对目标进行最终定位或者分类。1数据存储精度与存储空间在深度学习神经网络中,最常见的数据格式是float32,占4个字节(Byte)。类似地,float16,占2个字节。1024个字节为1KB,1024x1024个字节为1MB。那么......