首页 > 其他分享 >机器学习之最小二乘法

机器学习之最小二乘法

时间:2024-02-08 09:22:05浏览次数:25  
标签:误差 机器 模型 最小 观测 参数 乘法

最小二乘法概述

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。

简而言之,最小二乘法同梯度下降类似,都是一种求解无约束最优化问题的常用方法,并且也可以用于曲线拟合,来解决回归问题。

要解决的问题

在工程应用中,我们经常会用一组观测数据去估计模型的参数,比如我们有一组观测数据(x1,y1)(一维),通过一些数据分析我们猜测y和x之间存在线性关系,那么我们的模型就可以定为:f(x)=kx+b

这个模型只有两个参数,所以理论上,我们只需要观测两组数据建立两个方程,即可解出两个未知数。类似的,假如模型有n个参数,我们只需要观测n组数据就可求出参数,换句话说,在这种情况下,模型的参数是唯一确定解。

但是在实际应用中,由于我们的观测会存在误差(偶然误差、系统误差等),所以我们总会做多余观测。比如在上述例子中,尽管只有两个参数,但是我们可能会观测n组数据(x1,y1)..,(xn,yn),这会导致我们无法找到一条直线经过所有的点,也就是说,方程无确定解。

image

这就是我们要解决的问题:虽然没有确定解,但是我们能不能求出近似解,使得模型能在各个观测点上达到"最佳"拟合。那么"最佳"的准则是什么?可以是所有观测点到直线的距离和最小,也可以是所有观测点到直线的误差(真实值-理论值)绝对值和最小,也可以是其它,如果是你面临这个问题你会怎么做?

早在19世纪,勒让德就认为让"误差的平方和最小"估计出来的模型是最接近真实情形的。

为什么是误差平方而不是其它的,这个问题连欧拉、拉普拉斯都未能成功回答,后来是高斯建立了一套误差分析理论,从而证明了确实是使误差平方和最小的情况下系统是最优的。

按照勒让德的最佳原则,于是就是求:

image

这个目标函数取得最小值时的函数参数,这就是最小二乘法的思想,所谓"二乘"就是平方的意思。从这里我们可以看到,最小二乘法其实就是用来做函数拟合的一种思想。

至于怎么求出具体的参数那就是另外一个问题了,理论上可以用导数法、几何法,工程上可以用梯度下降法。

参考

一文让你彻底搞懂最小二乘法(超详细推导)
机器学习回顾篇(2):最小二乘法
机器学习十大经典算法之最小二乘法

标签:误差,机器,模型,最小,观测,参数,乘法
From: https://www.cnblogs.com/strongmore/p/17437936.html

相关文章

  • 机器学习如何改变缺陷检测的格局?
    机器学习在缺陷检测中扮演着重要的角色,它能够通过自动学习和识别各种缺陷的模式和特征,改变缺陷检测的格局。以下是机器学习在缺陷检测中的一些应用和优势:自动化检测:机器学习技术可以自动化处理大量的数据,通过学习和识别缺陷的模式和特征,实现自动化检测。这大大提高了缺陷检测的......
  • 给淘宝店铺接入第三方客服机器人需要花多少钱?
    在电商时代,淘宝卖家们都在追求高效率且低成本的运营模式。客服支出一直是我们店铺运营中一个不小的开销,同时快速响应顾客咨询又显得至关重要。许多卖家将目光转向了第三方GPT客服机器人,以期望通过自动化技术提高回复率并降低人力成本。然而,有的供应商一个店铺一年也就二三百,而有......
  • 机器学习中一维卷积的作用是什么
    一维卷积在机器学习中的应用特别适合处理时间序列数据或者是一维信号数据。其作用主要体现在以下几个方面:特征提取:一维卷积通过在数据上滑动一个较小的窗口(卷积核),并计算窗口内数据的加权和(可能还包括偏置项),从而在局部区域内提取特征。这种操作有助于识别一维数据中的局部模式和特征......
  • 2023机器人年度集锦:创新潮涌不断,火热新品回顾!
    原创|文BFT机器人近年来,随着科技的不断进步和市场需求的日益增长,机器人行业一直处于飞速发展的轨道,在短时间内取得了显著的成果。到了2023年,这一行业迎来了一股创新潮涌,企业们纷纷加速研发,推出了一系列令人瞩目的新产品。这不仅标志着我国机器人行业的崛起,也预示着未来市场竞争......
  • 打印九九乘法表
    需求打印九九乘法表代码实现packagecom.jichu.struct;publicclassForDemo03{publicstaticvoidmain(String[]args){//打印九九乘法表for(inti=1;i<10;i++){//i列for(intj=1;j<=i;j++){//j行int......
  • 代码随想录算法训练营第十三天 | 59.螺旋矩阵II 209.长度最小的子数组 977.有序数
    977.有序数组的平方 已解答简单 相关标签相关企业 给你一个按 非递减顺序 排序的整数数组 nums,返回 每个数字的平方 组成的新数组,要求也按 非递减顺序 排序。 示例1:输入:nums=[-4,-1,0,3,10]输出:[0,1,9,16,100]解释:平方后,数组变为[16......
  • 使用分形思想,通过图灵完备的机器赛跑关卡,并获得小机快跑成就
    本文作者:Wyu-Cnk前言最近在玩图灵完备(TuringComplete)一路过关斩将,来到机器赛跑(RobotRacing)这一关的时候,一看地图对于选修过分形几何的我来说,这不就是熟悉的希尔伯特曲线嘛!老朋友了!于是我复活已经死去的和分形几何有关的记忆,用分形的思想初步实现了对应的汇编......
  • GCD,乘法逆元
    最大公约数公约数:几个整数共有的约数。($\pm1是任何整数的公约数$)最大公约数:显而易见,所有公约数中最大的那个。欧几里得算法为了求最大公约数(常记为GCD),我们常用欧几里得算法。以两个数的最大公约数为例。设正整数a,b。不妨假设\(a>b\)。\[gcd(a,b)=gcd(b,a\mod\b)\]证明......
  • Python 机器学习 特征预处理
    1、缩放特征(FeatureScaling)特征预处理是一个重要的步骤,而特征缩放(FeatureScaling)是其中的一个关键环节。特征缩放通常用于标准化数据集中各个特征的范围,使它们在相似的尺度上。这一步骤对于许多机器学习算法特别重要,尤其是那些基于距离的算法(如K-近邻)和梯度下降法(如线性回归、......
  • 最小生成树
    记录18:222024-2-1目录1.最小生成树1.Prim2.Kruskal1.最小生成树1.Prim类似dijkstra,优化可以用最小堆来维护权值最小边点击查看代码constintINF=0x3f3f3f3f;intcost[MAX_V][MAX_V];//cost[u][v]边e(u,v)的权重不存在设为INFintmincost[MAX_V];boolused[MAX......