首页 > 其他分享 >最小二乘法 good

最小二乘法 good

时间:2022-12-20 10:31:30浏览次数:47  
标签:good 函数 样本 最小 乘法 数据 估计量

最小二乘法也称为最小平方法,是一种数据优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。

最小二乘法最初由高尔顿在创立回归分析的时候提出,现在已经成为探索变量间关系最重要的方法,最小二乘法根据其数学原理命名,即误差平方和最小,在误差平方和最小状态下进行函数参数估计,可认为是参数的最佳估计。

一、问题的提出
我们在研究变量间的关系时,会收集一定量的数据样本,这些数据在二维坐标图上呈现为一个个的数据点,理论上来讲,如果变量间存在确定的已知函数关系,则函数图像(曲线或直线)会经过所有的数据点,而通常我们得到的数据都是样本数据,样本数据存在误差,导致我们根据样本数据计算出的函数和已知函数也存在误差,其函数图像无法经过所有数据点。

误差使得多次试验的样本数据所呈现的函数图像会不同,即使是同一组样本数据,如果没有统一的标准,那么不同的人去描绘所呈现的函数图像也会不同。

而我们就是要找到一条标准,使得从这些存在误差的样本数据中求出一个近似函数,使得它和已知函数最为接近,这个近似函数的图像不一定要经过所有的数据点,但是要尽可能的使所有数据点对称且均匀的分布在其两侧,并且这条线既能反映数据的总体分布,也不至于出现局部的较大波动,通过一个近似函数去拟合已知函数,这样就是曲线拟合问题。

一般来说。曲线拟合的任务有两个:
1.当变量间的函数关系已知,只是其中的常数未知,根据数据点拟合出各常数的最佳估计值。
2.当变量间的函数关系未知,根据数据点拟合出变量间函数关系的经验公式,并求出其中各常数的最佳估计值。

二、问题的解决
前面说过,如果没有一条标准,可以找到无数个近似函数,我们可以按照以下原则进行思考:

1.为了精确而全面的描述变量间的关系,必须使用这组变量的全部观察值(实际上很难做到,一般都使用样本数据)
2.确定变量间的关系是直线还是曲线,要根据协方差或相关系数进行判断
3."最好"的近似函数,应该和已知函数偏差最小,对于函数图像来说,就是所有数据点到这个函数图像(曲线或直线)的垂直距离的和最小。

按照以上原则,我们来进行分析:
设已知函数y=f(x),近似函数为φ(x)
令δi=yi-φ(xi)
δi就是残差,让残差最小,有不同的方法

最小二乘法  good_数据



其中第四种——偏差的平方和最小,就是最小二乘法。


在实际应用中,样本数据并不都是等精度、等地位的,对于精度高、地位重的数据应该给予更大的权重,这时要使用加权最小二乘法。

===============================================================

使用最小二乘法估计出的回归方程具有以下性质:

1.无偏性

可以证明最小二乘法估计出的回归方程中各参数的期望(均值)等于真实方程中的参数值

假设一个线性回归方程的形式如下

最小二乘法  good_最小二乘法_02


使用最小二乘估计出的回归方程为

最小二乘法  good_数据_03

则有

最小二乘法  good_最小二乘法_04



2.线性可以证明使用最小二乘法估计出的参数是Y的线性函数

最小二乘法  good_数据_05



3.最小方差性

对同一个样本,使用不同的方法进行估计,会得到不同的参数,这些参数也可能是无偏的和线性的,但是在这些参数中,可以证明使用最小二乘法估计出的参数方差最小。

以上三个性质也是评价一个参数是否为优良参数的参考标准,由于最小二乘法估计量同时具备这三条性质,因此也称为最小二乘法估计量为最佳线性无偏估计量best linear unbiased estimate,简称BLUE

在高斯经典假设条件下,我们不需要再去寻找其它无偏估计量,没有一个会优于普通最小二乘估计量。也就是说,如果存在一个好的线性无偏估计量,这个估计量的方差最多与普通最小二乘估计量的方差一样小,不会小于普通最小二乘估计量的方差,这个定理称为高斯-马尔科夫定理。正是因为最小二乘法估计量具有BLUE性质,才使得最小二乘法得到广泛应用,但是要注意的是,最小二乘估计量这些优良的性质,依赖于高斯基本假设。

 

对于一个实际的曲线拟合问题,通常的做法是将观测值在二维坐标平面上画出散点图,观察散点图的分布和哪类曲线图接近,然后选用相应的曲线拟合方程,对于有些非线性拟合曲线可以通过适当的变量替换转化为线性拟合曲线,按照线性拟合进行处理,这样会简便一些,下图列举了一些常见的变换

最小二乘法  good_数据_06


标签:good,函数,样本,最小,乘法,数据,估计量
From: https://blog.51cto.com/u_15147537/5954266

相关文章

  • 最小二乘法求解线性回归模型
    ✅作者简介:热爱科研的算法开发者,Python、Matlab项目可交流、沟通、学习。......
  • 二叉树的最大/最小深度
    1.深度与高度二叉树节点的深度:指从根节点到该节点的最长简单路径边的条数或者节点数(取决于深度从0开始还是从1开始)二叉树节点的高度:指从该节点到叶子节点的最长简单路径......
  • déce. 19 最小生成树
    https://www.luogu.com.cn/problem/P2330题设就已经吧最小生成树的思想写出来了其实就是个贪心一遍过#include<bits/stdc++.h>usingnamespacestd;#defineinRead(......
  • 使用Akka、Kafka和ElasticSearch等构建分析引擎 -- good
    本文翻译自​​BuildingAnalyticsEngineUsingAkka,Kafka&ElasticSearch​​,已获得原作者SatendraKumar和网站授权。在这篇文章里,我将和大家分享一下我用Scala、Akka......
  • 5.1 入门整合案例(SpringBoot+Spring-data-elasticsearch) ---- good
    本节讲解SpringBoot与Spring-data-elasticsearch整合的入门案例。一、环境搭建新建maven项目,名字随意pom.xml<parent><groupId>org.springframework.boot</groupId><artifac......
  • Spring MVC异常处理详解 ExceptionHandler good
     @ControllerAdvice(basePackageClasses=AcmeController.class)publicclassAcmeControllerAdviceextendsResponseEntityExceptionHandler{@ExceptionHandler(Yo......
  • ThreadLocal是否会引发内存泄露的分析 good
    这篇文章,主要解决一下疑惑:1. ThreadLocal.ThreadLocalMap中提到的弱引用,弱引用究竟会不会被回收?2. 弱引用什么情况下回收?3.JAVA的ThreadLocal和在什么情况下会内存泄露? ......
  • 有向图最小环的三种普遍求法 Dijkstra
    有向图的最小环问题Dijkstra两点距离和跑\(n\)遍\(\text{Dijkstra}\)求出任意两点间距离,然后枚举任意两点\(i,j\),可以发现\(dist[i][j]+dist[j][i]\)就是一个可......
  • 最小的 x86 Linux 模拟器:blink
    1.1最小的x86Linux模拟器:blink主语言:CNewblink是一款虚拟机可用来跑静态编译的x86-64Linux,它适用于不同的操作系统和硬件架构。它和qemu-x86_64实现类似功能,除......
  • 史上最小 x86 Linux 模拟器「GitHub 热点速览 v.22.50」
    本周GitHubTrending略显冷清,大概是国内的人们开始在养病,而国外的人们开始过圣诞、元旦双节。热度不减的ChatGPT依旧占据了本周大半的GitHub热点项目,不过本周的特推......