首页 > 其他分享 >PAC学习框架

PAC学习框架

时间:2023-05-31 12:37:47浏览次数:37  
标签:sample 概率 r1 框架 个数 学习 PAC

PAC学习框架是机器学习的基础。它主要用来回答以下几个问题:

  1. 什么问题是可以高效学习的?
  2. 什么问题本质上就难以学习?
  3. 需要多少实例才能完成学习?
  4. 是否存在一个通用的学习模型?

PAC=probably approximately correct,很可能接近正确的

---------------------

什么问题能得到“可能接近正确”的结果呢?原文说的比较抽象,我把他翻译下:

说一个问题是PAC可学习的,需要定义m个sample组成S空间,其中每个sample服从D分布,并且互相独立;

如果存在一个算法A,在m(sample个数)有限的情况下,找到假设h;

使得对于任意两个数x,y,概率P(h对S中sample预测错误次数大于x) < y;

xy对应PAC学习框架_二维 中两个奇怪的符号!注意上面说的是小于,截图中说的是相反事件的大于。其实是一回事。

那么该问题是PAC可学习的。

----

举个例子,在二维平面上去学习一个矩阵:

PAC学习框架_并集_02

目标是找到R,R内部的点是蓝色的,外部的点是红色的。

为了证明上面的问题是PAC可学习的,我们需要找到一个算法A,并且证明只需要m个实例,就可以是的概率等式成立。

首先确定算法:

PAC学习框架_机器学习_03

这个算法很简单,就是所有蓝色的点的最小矩形R。那么这个R能不能满足上面的概率等式呢?假设给定x和y。如果错误个数大于x的概率小于y,需要什么条件呢?

不好回答,因此我们需要做一个转换:

PAC学习框架_并集_04

我们先沿着R的4条边,向内部扩展,画出4个小矩形:r1,2,3,4。每个r的概率x/4。

如果R’的错误个数大于x,那么R’必然与r1,2,3,4中的至少一个有交集。(否则错误个数必定小于x)

因此有不等式:

PAC学习框架_二维_05

由于并集的概率小于各自概率的和:

PAC学习框架_并集_06

由于S中的每个sample的独立分布的,并且落在r1中的概率为x/4,所以

PAC学习框架_二维_07

由于我们要求错误个数大于x的概率小于y,所以可以定义如下的不等式。

PAC学习框架_并集_08

推导出m的下限。

这就说明只需要有限个实例就能满足上面的概率不等式。

------------------------------------------------

这就说明了,上面这个平面图形中学习矩形的问题是PAC可学习的。

标签:sample,概率,r1,框架,个数,学习,PAC
From: https://blog.51cto.com/u_11908275/6385940

相关文章

  • 超参数调优——google Vizier采用迁移学习的思想,主要是从之前调参的经验中学习,为新算
    Google使用一套超参数调优算法来烘焙更美味的饼干“超参数调优”和“烘焙饼干”这两件事情,乍一听感觉风马牛不相及,但细想一下,似乎又有一定的相似之处——“黑盒优化”。结构复杂的深度学习模型某种程度上就是一个黑盒,为实现更好的优化目标,我们不断进行“超参数调优”来优化这个黑盒......
  • 机器学习样本标记 示意代码
    目标:根据各个字段数据的分布(例如srcIP和dstIP的top10)以及其他特征来进行样本标注,最终将几类样本分别标注在black/white/ddos/mddos/cdn/unknown几类。效果示意:-------------chooseone--------------subdomain:DNSQueryName(N)ip:srcip(S)ordstip(D)length:DNSRequestLength......
  • SpringBoot定义优雅全局统一Restful API 响应框架五
    闲话不多说,继续优化全局统一RestfulAPI响应框架做到项目通用接口可扩展。如果没有看前面几篇文章请先看前面几篇SpringBoot定义优雅全局统一RestfulAPI响应框架SpringBoot定义优雅全局统一RestfulAPI响应框架二SpringBoot定义优雅全局统一RestfulAPI响应框架三Sp......
  • Golang扫盲式学习——GO并发 | (一)
    并发与并行......
  • 零样本学习(Zero-shot Learning)
    零样本学习是一种机器学习的问题设置,其中模型可以对从未在训练过程中见过的类别的样本进行分类,使用一些形式的辅助信息来关联已见和未见的类别。例如,一个模型可以根据动物的文本描述来识别动物,即使它从未见过那些动物的图像。实现零样本学习有不同的方法,取决于辅助信息的类型和学......
  • git学习笔记——无法将本地仓库与远程仓库合并
    我本地的仓库是通过gitinit创建的,而远程仓库是直接在gitee创建的,所以这两个仓库是不同的仓库所以当push本地仓库到远程仓库的时候会失败。解决方法:#通过在后面添加以下内容即可忽略这个问题--allow-unrelated-histories#例如:gitpulloriginmaster--allow-unrelated-his......
  • PID学习(一):基本概念+例子理解
    一、定义在过程控制中,按偏差的比例(P)、积分(I)和微分(D)进行控制的PID控制器(亦称[PID调节器],是应用最为广泛的一种自动控制器。PID即:Proportional(比例)、Integral(积分)、Differential(微分)的缩写二、各部分详解总述: image.png1.比例系数P在y=k·x中的,k是比例系数p。......
  • Linux学习笔记
    一、有哪些查看日志的命令?tail:用于查看最后几行文件的内容,常用于查看日志文件的尾部新添加的内容。例如:tail-f/var/log/system.log会实时输出system.log文件的末尾。less:用于查看大型文本文件的内容,可以按页或行进行查看,支持上下翻页、搜索等功能。例如:less/var/log/sys......
  • 基于学习的第三代测序一致性序列生成
    基于学习的第三代测序一致性序列生成王水介哈尔滨工业大学摘要:继人类基因组计划开展以来,基因测序已经广泛影响了生命科学的研究方式,各模式物种基因组在全球实验室不断被测定分析。近年来随着基因组测序数据通量的提升和成本的下降,这已成为生物医学领域的常规手段。目前以......
  • NeoVim 学习笔记
    NeoVim学习笔记这篇学习笔记将用于记录本人在学习使用NeoVim编辑器过程中所编写的学习心得与代码。该笔记将会存放在https://github.com/owlman/study_note项目的SoftwareTool/DevelopmentTool目录下,并予以长期维护。学习规划学习基础:掌握Linuxshell命令的基本使用。......