万普尼克(Vapnik)建立的一套机器学习理论,使用统计的方法,因此有别于归纳学习等其它机器学习方法。由这套理论所引出的支持向量机对机器学习的理论界以及各个应用领域都有极大的贡献,一般情况下弗拉基米尔-万普尼克理论是香农实验室奠基资料和自身的数学背景。
目前理论分析方面有间隔(Margin)和损失()函数两种观点。1992年到2004年期间,V-Vapnik研究处于间隔时代,在L-Valiant提出的概率近似正确理论(Probably Approximately Correct,PCA),基于VC维(Vapnik-Chervonekis)的模型泛化能力的概率近似正确的上界,1998年肖—泰勒(Shawe -taylor)发现了量化模型泛化能力的间隔界限,此时基于间隔的算法得到了认可,学习所获得间隔越大泛化能力也就越强。间隔是泛化能力的指标,通常的间隔是有实际物理意义,一般认为是几何间隔和几何距离,线性可分的情况下是样本Margin是该点到分类平面的欧式距离,样本集合叫分类器,指样本点间隔中的最小者。
bshq:机器学习基础-《统计学习-SLT》教材分享
推荐一本伊利诺伊大学香槟分校电气与计算机工程系和协调科学实验室的Bruce Hajek和 Maxim Raginsky编写的《统计学习-SLT》教材。
本书目录
本书内容节选