重磅干货 | 从连续的视角看机器学习

时间：2022-10-31 15:03:20浏览次数：54

本文于2020年发表于《中国科学：数学》杂志。作者为鄂维南（普林斯顿大学、北京大数据研究院）、马超（普林斯顿大学）和吴磊（普林斯顿大学）。英文论文PDF文件下载请在本公众号回复关键词“机器学习连续视角”。

摘要

在经典数值分析的影响下，我们提出了一个连续的机器学习形式，将其作为变分法和微分积分方程中的一个问题。我们证明了传统的机器学习模型和算法，如随机特征模型、两层神经网络模型和残差神经网络模型，都可以表示成（以比例形式）对应连续形式的离散化的特例。我们还提供了从这种连续形式自然产生的新模型，例如基于流的随机特征模型，以及新算法，例如平滑粒子方法和谱方法。我们讨论了如何在这个框架下研究泛化误差和隐式正则化问题。

提纲

1.介绍
2.函数的表示

2.1 基于积分变换的表示
2.2 基于流的表示

3.优化问题
3.1 有监督学习
3.2 降维
3.3 变分法
3.4 非线性抛物偏微分方程
4.梯度流
4.1 保守和非保守梯度流
4.2 基于流模型的Pontryagin最大值原理
4.3 基于流的随机特征模型
4.4 基于流的神经网络的梯度流
5.离散化
5.1 还原两层神经网络模型
5.2 平滑粒子法
5.3 基于积分变换模型的一种新算法
6.泛化误差
6.1 离散化模型分析
6.2 连续模型分析
7.一个例子
7.1 均匀目标分布的全局收敛性
7.2 一般情况下的局部收敛性
7.3 数值结果
7.4 频率原理
8.讨论

讨论

这里提出的连续视角提供了一种更抽象的机器学习的思考方式。重点关注函数的表示、变分法问题和连续梯度流。特征和神经元作为对象出现在这些连续问题的特殊离散化中。

我们从这个思考过程中至少学到了两件事。一方面，我们可以不借助神经元的概念来讨论机器学习，实际上除了神经网络模型之外，还有很多算法和模型。另一方面，我们也看到了为什么神经网络（浅层和深层）是不可避免的选择：它们是最简单的连续梯度流模型的最简单粒子方法离散化（分别用于基于积分变换和基于流的表示）。

经典数值分析的一个主要主题是提出更好的模型和算法的设计原则。本着这种精神，我们可以为连续机器学习方法提出以下一组原则：

1.目标函数应该以各种形式表示为期望。
2.风险泛函应该是好泛函。即使不是凸的，它们也应该具有凸泛函的许多特征。好的一点是，如果我们从连续模式开始，离散化模型很可能不会被离散效应导致的局部极小所困扰。
3.不同的梯度流是很好的流，即相关范数应在流上变现良好。这里相关范数指与特定表示相关的范数（例如，基于积分变换的表示的Barron范数）。
4.流的数值离散化应在较长的时间间隔内保持稳定。

我们认为如果遵循这组设计原则，所得到的模型和算法将以一种相当健壮的方式运行，而当前的机器学习模型往往敏感地依赖于超参数的选择。

当前机器学习算法中的一些微妙之处，仅仅是从一个连续的角度来看待就已经可以被理解了。例如，非常深的全连接网络应该会引起问题，因为它们没有很好的连续极限[35]。

英文论文PDF文件下载请在本公众号回复关键词“机器学习连续视角”。

重磅干货 | 从连续的视角看机器学习_离散化

标签：重磅,学习,视角,机器,模型,基于,离散,干货,连续
From： https://blog.51cto.com/u_15622928/5809763

重磅综述 | 神经网络机器学习的数学理解
本文是由鄂维南院士、马超、吴磊和StephanWojtowytsch2020年12月发表在CSIAMTransactionsonAppliedMathematics上的综述文章。原文题目为“TowardsaMathematicalU......
#yyds干货盘点#数据可视化总结
最近在做可视化相关的项目，借这篇文章今天谈谈数据可视化相关的技术解决方案。数据可视化旨在借助于图形化手段，清晰有效地传达与沟通信息（来源于bd）.在我们生活中最常见的，就有......
#yyds干货盘点# 动态规划专题：计算字符串的编辑距离
1.简述：描述Levenshtein 距离，又称编辑距离，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符，插入一个字符，删......
#yyds干货盘点# 动态规划专题：正则表达式匹配
1.简述：描述请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符，而'*'表示它前面的字符可以出现任意次（包含0次）。在本题中，匹配是指字符串的所......
谈谈甲方视角下网络安全产品及安全建设
当前网络安全整体行业的加速驱动，传统安全已趋于成熟，技术应用已相对广泛，新的技术以及新场景化的应用，如何将产品从前期试用到后期结合甲方的实际环境进行实用化，融合化是当前很......
满满干货！成人高考各科目答题技巧，必看完！
成考专升本考试除了公共科目外，还有一些专业科目，比如大学语文、高数、医学综合、教育理论等，你对于这些科目的复习够了解吗?首先答题攻略一定要牢记！答题总体要求：会做的要做......
#yyds干货盘点#Vue3.2 新指令 v-memo解析
v-memo官方定义缓存一个模板的子树。在元素和组件上都可以使用。为了实现缓存，该指令需要传入一个固定长度的依赖值数组进行比较。如果数组里的每个值都与最后一次的渲染相......
#yyds干货盘点# LeetCode 腾讯精选练习 50 题：旋转链表
题目：给你一个链表的头节点head，旋转链表，将链表每个节点向右移动 k 个位置。示例1：输入：head=[1,2,3,4,5],k=2输出：[4,5,1,2,3]示例2：输入：head=[0,1,2],k=4输出......
#yyds干货盘点# LeetCode 腾讯精选练习 50 题：不同路径
题目：一个机器人位于一个mxn 网格的左上角（起始点在下图中标记为“Start”）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为“Finis......
#yyds干货盘点# 动态规划专题：滑雪
1.简述：描述NowCoder喜欢滑雪，因为滑雪的确很刺激。为了获得速度，必须从高处往低处滑。现在知道某片区域的海拔，如下所示1 2 3 4516171819615242520714......

重磅干货 | 从连续的视角看机器学习

摘要

提纲

讨论

相关文章

赞助商

阅读排行