首页 > 其他分享 >重磅干货 | 从连续的视角看机器学习

重磅干货 | 从连续的视角看机器学习

时间:2022-10-31 15:03:20浏览次数:54  
标签:重磅 学习 视角 机器 模型 基于 离散 干货 连续

本文于2020年发表于《中国科学:数学》杂志。作者为鄂维南(普林斯顿大学、北京大数据研究院)、马超(普林斯顿大学)和吴磊(普林斯顿大学)。英文论文PDF文件下载请在本公众号回复关键词“机器学习连续视角”。

摘要

在经典数值分析的影响下,我们提出了一个连续的机器学习形式,将其作为变分法和微分积分方程中的一个问题。我们证明了传统的机器学习模型和算法,如随机特征模型、两层神经网络模型和残差神经网络模型,都可以表示成(以比例形式)对应连续形式的离散化的特例。我们还提供了从这种连续形式自然产生的新模型,例如基于流的随机特征模型,以及新算法,例如平滑粒子方法和谱方法。我们讨论了如何在这个框架下研究泛化误差和隐式正则化问题。

提纲

  • 1.介绍
  • 2.函数的表示
  • 2.1 基于积分变换的表示
  • 2.2 基于流的表示
  • 3.优化问题
  • 3.1 有监督学习

  • 3.2 降维

  • 3.3 变分法

  • 3.4 非线性抛物偏微分方程

  • 4.梯度流

  • 4.1 保守和非保守梯度流

  • 4.2 基于流模型的Pontryagin最大值原理

  • 4.3 基于流的随机特征模型

  • 4.4 基于流的神经网络的梯度流

  • 5.离散化

  • 5.1 还原两层神经网络模型

  • 5.2 平滑粒子法

  • 5.3 基于积分变换模型的一种新算法

  • 6.泛化误差

  • 6.1 离散化模型分析

  • 6.2 连续模型分析

  • 7.一个例子

  • 7.1 均匀目标分布的全局收敛性

  • 7.2 一般情况下的局部收敛性

  • 7.3 数值结果

  • 7.4 频率原理

  • 8.讨论

讨论

这里提出的连续视角提供了一种更抽象的机器学习的思考方式。重点关注函数的表示、变分法问题和连续梯度流。特征和神经元作为对象出现在这些连续问题的特殊离散化中。

我们从这个思考过程中至少学到了两件事。一方面,我们可以不借助神经元的概念来讨论机器学习,实际上除了神经网络模型之外,还有很多算法和模型。另一方面,我们也看到了为什么神经网络(浅层和深层)是不可避免的选择:它们是最简单的连续梯度流模型的最简单粒子方法离散化(分别用于基于积分变换和基于流的表示)。

经典数值分析的一个主要主题是提出更好的模型和算法的设计原则。本着这种精神,我们可以为连续机器学习方法提出以下一组原则:

  • 1.目标函数应该以各种形式表示为期望
  • 2.风险泛函应该是好泛函。即使不是凸的,它们也应该具有凸泛函的许多特征。好的一点是,如果我们从连续模式开始,离散化模型很可能不会被离散效应导致的局部极小所困扰。
  • 3.不同的梯度流是很好的流,即相关范数应在流上变现良好。这里相关范数指与特定表示相关的范数(例如,基于积分变换的表示的Barron范数)。
  • 4.流的数值离散化应在较长的时间间隔内保持稳定

我们认为如果遵循这组设计原则,所得到的模型和算法将以一种相当健壮的方式运行,而当前的机器学习模型往往敏感地依赖于超参数的选择。

当前机器学习算法中的一些微妙之处,仅仅是从一个连续的角度来看待就已经可以被理解了。例如,非常深的全连接网络应该会引起问题,因为它们没有很好的连续极限[35]。

英文论文PDF文件下载请在本公众号回复关键词“机器学习连续视角”。

重磅干货 | 从连续的视角看机器学习_离散化

标签:重磅,学习,视角,机器,模型,基于,离散,干货,连续
From: https://blog.51cto.com/u_15622928/5809763

相关文章

  • 重磅综述 | 神经网络机器学习的数学理解
    本文是由鄂维南院士、马超、吴磊和StephanWojtowytsch2020年12月发表在CSIAMTransactionsonAppliedMathematics上的综述文章。原文题目为“TowardsaMathematicalU......
  • #yyds干货盘点#数据可视化总结
    最近在做可视化相关的项目,借这篇文章今天谈谈数据可视化相关的技术解决方案。数据可视化旨在借助于图形化手段,清晰有效地传达与沟通信息(来源于bd).在我们生活中最常见的,就有......
  • #yyds干货盘点# 动态规划专题:计算字符串的编辑距离
    1.简述:描述Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删......
  • #yyds干货盘点# 动态规划专题:正则表达式匹配
    1.简述:描述请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。在本题中,匹配是指字符串的所......
  • 谈谈甲方视角下网络安全产品及安全建设
    当前网络安全整体行业的加速驱动,传统安全已趋于成熟,技术应用已相对广泛,新的技术以及新场景化的应用,如何将产品从前期试用到后期结合甲方的实际环境进行实用化,融合化是当前很......
  • 满满干货!成人高考各科目答题技巧,必看完!
    成考专升本考试除了公共科目外,还有一些专业科目,比如大学语文、高数、医学综合、教育理论等,你对于这些科目的复习够了解吗?首先答题攻略一定要牢记!答题总体要求:会做的要做......
  • #yyds干货盘点#Vue3.2 新指令 v-memo解析
    v-memo官方定义缓存一个模板的子树。在元素和组件上都可以使用。为了实现缓存,该指令需要传入一个固定长度的依赖值数组进行比较。如果数组里的每个值都与最后一次的渲染相......
  • #yyds干货盘点# LeetCode 腾讯精选练习 50 题:旋转链表
    题目:给你一个链表的头节点head,旋转链表,将链表每个节点向右移动 k 个位置。 示例1:输入:head=[1,2,3,4,5],k=2输出:[4,5,1,2,3]示例2:输入:head=[0,1,2],k=4输出......
  • #yyds干货盘点# LeetCode 腾讯精选练习 50 题:不同路径
    题目:一个机器人位于一个mxn 网格的左上角(起始点在下图中标记为“Start”)。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为“Finis......
  • #yyds干货盘点# 动态规划专题:滑雪
    1.简述:描述NowCoder喜欢滑雪,因为滑雪的确很刺激。为了获得速度,必须从高处往低处滑。现在知道某片区域的海拔,如下所示1 2 3 4516171819615242520714......