号称能打败MLP的KAN到底行不行？数学核心原理全面解析

时间：2024-05-08 11:37:53浏览次数：24

标签：函数 mlp Kolmogorov kan Arnold KAN MLP 行不行

前几天火爆的Kolmogorov-Arnold Networks是具有开创性，目前整个人工智能社区都只关注一件事LLM。我们很少看到有挑战人工智能基本原理的论文了，但这篇论文给了我们新的方向。

mlp或多层感知位于AI架构的最底部，几乎是每个深度学习架构的一部分。而KAN直接挑战了这一基础，并且也挑战了这些模型的黑箱性质。

也许你看到了很多关于KAN的报告，但是里面只是简单的描述性介绍，对于他的运行原理还是不清楚，所以我们这篇文章将涉及大量的数学知识，主要介绍KAN背后的数学原理。

KAN

Kolmogorov-Arnold Networks引入了一种基于Kolmogorov-Arnold表示定理的新型神经网络架构，为传统的多层感知器(mlp)提供了一种有前途的替代方案。

mlp在节点(“神经元”)上有固定的激活函数，而kan在边缘(“权重”)上有可学习的激活函数。kan根本没有线性权重，每个权重参数都被参数化为样条的单变量函数。这个看似简单的改变使得KANs在准确性和可解释性方面优于mlp。KANs是mlp的有希望的替代品，为进一步改进当今严重依赖mlp的深度学习模型提供了机会。

上面论文的原文，根据论文在数据拟合和PDE求解方面，更小的kan与更大的mlp相当或更好。所以kan可能比mlp拥有更快的神经缩放定律。并且KANs可以直观地可视化，大大提高了可解释性。

论文围绕函数逼近的Kolmogorov-Arnold表示定理的性质展开，这是这篇论文的全部前提。

表示定理基础:函数被分解成更简单的函数，然后使用神经网络进行近似。

平滑性和连续性:目标是确保原始多元函数的平滑性有效地转化为神经网络近似。

空间填充曲线:函数跨维度的属性，特别是关注在近似过程中如何保持连续性和其他函数属性或转换。

https://avoid.overfit.cn/post/6ee2307e614b462f9c9aac26ef12252d

标签：函数,mlp,Kolmogorov,kan,Arnold,KAN,MLP,行不行
From： https://www.cnblogs.com/deephub/p/18179317

MLP实现minist数据集分类任务
1.数据集minist手写体数字数据集2.代码'''Description:Author:zhangyhDate:2024-05-0415:21:49LastEditTime:2024-05-0422:36:26LastEditors:zhangyh'''importnumpyasnpclassMlpClassifier:def__init__(self,input_si......
MLP实现波士顿房屋价格回归任务
1.数据集波士顿房屋价格.csv文件，文件中的数据有可能不完整，部分数据如下：CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,LSTAT,MEDV0.00632,18,2.31,0,0.538,6.575,65.2,4.09,1,296,15.3,4.98,240.02731,0,7.07,0,0.469,6.421,78.9,4.9671,2,242,17.8,9.14,21.60.02......
Kano的编程之旅
瓦力觉启|主程序原理---避障|目录一.雷达避障(1)(2)二.深度避障1.原理2.控制3.主要函数(1).雷达避障主函数(2).相关参数三.超声波避障今日份美图一.雷达避障(1)(2)二.深度避障1.原理(1)摄像头的中心与摄像头坐标系统的中心可能存在偏差(2)摄像头的坐标系和小车的坐标......
[深度学习]多层感知机（MLP）
多层感知机（MLP）1.单层感知机1.1感知机线性回归输出的是一个实数，感知机输出的是一个离散的类。1.2训练感知机①如果分类正确的话y<w,x>为正数，负号后变为一个正数，和\(0\)取\(max\)之后得\(0\)，则梯度不进行更新②如果分类错了，y<w,x>为负数，的判断条件成立，就进行梯度更新。......
52 Things: Number 35: Give the rough idea of Pollard rho, Pollard "kangaroo" and
52Things:Number35:GivetheroughideaofPollardrho,Pollard"kangaroo"andparallelPollardrhoattacksonECDLP.52件事：第35件：大致了解Pollardrho、Pollard“袋鼠”和平行的Pollardrho对ECDLP的攻击。 Thisisthelatestinaseriesofblogpoststoadd......
漫谈：编码、哈希、摘要、加密都是什么（别再问“用base64加密行不行”了，会被鄙视）
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。刚接触加密领域的新手经常搞不清楚这几个概念，这里给大......
【爬虫】项目篇-在https://www.kanunu8.com/book2抓取电子书
目录1)使用正则表达式2)使用bs41)使用正则表达式#使用requests库和正则表达式抓取在https://www.kanunu8.com/book3/任选的一本电子书importrequestsimportreimportosimporttimeheader={'user-agent':"Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit......
golang语言系列：Scrum、Kanban等敏捷管理策略
云原生学习路线导航页（持续更新中）本文是golang语言系列文章，主要对编程通用技能Scrum、Kanban等敏捷管理策略进行学习1.什么是敏捷开发敏捷是一个描述软件开发方法的术语，它强调增量交付、团队协作、持续规划和持续学习。2001年，敏捷宣言提出：个体和交互胜过流程和......
NVIDIA H200 创下 MLPerf LLM 最新推理记录
NVIDIAH200TensorCoreGPU和NVIDIATensorRT-LLM创下MLPerfLLM最新推理记录生成式人工智能正在解锁新的计算应用程序，通过持续的模型创新来极大地增强人类的能力。生成式AI模型（包括大型语言模型(LLM)）用于制作营销文案、编写计算机代码、渲染详细图像、创作音......
01-VulkanTutorial代码整理
创建Vulkan实例//01_instance_creation.cpp#defineGLFW_INCLUDE_VULKAN#include<GLFW/glfw3.h>#include<iostream>#include<stdexcept>#include<cstdlib>constintWIDTH=800;constintHEIGHT=600;classHelloTriangleApplication......

号称能打败MLP的KAN到底行不行？数学核心原理全面解析

KAN

相关文章

赞助商

阅读排行