首页 > 其他分享 >为什么刷题想得越多,考得反而越差?---过拟合现象带来的思考和启迪

为什么刷题想得越多,考得反而越差?---过拟合现象带来的思考和启迪

时间:2025-01-19 23:57:00浏览次数:3  
标签:11 视频 这个 多项式 --- 越差 拟合 考得 我们

文章目录

1.声明

这个系列的文章用来记录学习这个漫士沉思录(b站知名up主)的相关的科普视频,后续可能会有这个领域的其他的博主,例如乐天垂星之类的,这个是本专栏视频的来源,若有侵权,请联系删除;

下面的文章里面的引用的内容来自于这个视频里面的截取,非本人的原创~~;

今天是我正式认识了这个漫士沉思录up,之前学习的那个manim视频里面是有这个up联合创作的,但是当时并没有在意他,但是今天的这个视频我觉得做得很好,让我受益颇多,很有启发意义;

2.开篇

下面的这个既是开篇,也是这个视频的启迪意义所在,看完整个视频,我对于这句话才有了更加深刻的理解;我强烈建议大家前去观看原版视频,必看文章的效果更好;

image-20250119164413952

3.问题的引入

其实这个题目就是数学建模里面的回归分析,如何进行拟合,这个优度怎么样:

下面的这个是使用的一次函数多项式进行拟合的这个情况;

image-20250119195138965

下面的是使用的抛物线进行拟合的情况:

image-20250119195332722

下面的是使用三次多项式进行拟合:

image-20250119195224353

下面的是使用的11次的多项式进行拟合的效果,可以看到在 这个情况下,我们的这个曲线是经过了所有的点的;

image-20250119195404020

4.总结

1)我们可以看到这个欠拟合和过拟合,欠拟合的时候,这个得到的规律并不是很好,因为有些点的这个偏离的程度比较远,但是这个过拟合同样不好,因为我们的这个数据是存在波动的;

2)噪声:就是我们的数据集是12个月份对应的温度,并不是每一年的这个对应的月份都是一个温度,而是在一个范围里面进行波动,这个情况就是我们说的这个噪声;

image-20250119202719233

3)这个过拟合的情况下,最高项次数是11,为什么会是这个数字呢,因为我们有12个数据,可以唯一确定一个11次的多项式,这个实际上就是拉格朗日插值法的运用,但是他过拟合就是因为他根本不会考虑这个噪声,而是找到一个完美经过每一个点的这个曲线即可;

4)下面的这个就是我们的系数值:可以看到这个数值很大,这个就是因为我们的这个11次的多项式想要非常精确的解释这个里面用到的点,所以很容易受到这个数据的影响,只要我们稍微改变这个数据集,这个对应的系数就会很敏感的发生变化;

image-20250119203222288

5)左右两个对比可以发现,都是小于c的,这个c就是我们的这个误差的一个检验的指标,只要再这个允许的范围里面就可以;
但是可能我们的11次的就是误差为0,但是我们的普通的拟合虽然有误差,但是这个误差我们是可以接受的,而且这个普通的拟合考虑了这个噪声的影响,反而进行预测的效果会更好;

image-20250119203439585

6)经典题目:就是我们小学的时候经常写的这个题目,现在你就可以知道,这个题目的答案不唯一,因为我们可以填上任意一个数字,根据这几个数字求解一个多项式满足这个题目;

可能10年前,我们会不假思索的给出答案9,但是现在我们可以给出来很多个答案,并且根据这个拉格朗日的插值原理进行解释,当我看到这里的时候,确实很感慨;

image-20250119203459396

5.正则化的思想解释

这个单词的前半部分是我们熟悉的这个regular,实际上因为这个翻译的原因,我们可能看不出来这个真正的意思,但是当回归英文这种地道的表达的时候,就会很容易理解了些;

regular实际上就是普通的意思,对于这个模型而言,就是让这个模型普通一些,不要过于的复杂,因为过于复杂反而会适得其反,效果不是很好,所以我们的先贤早就告诉我们:大道至简;

image-20250119204055984

6.奥卡姆剃刀原理

image-20250119204127369

7.对于刷题现象的解释

为什么很多人刷题刷的太多,反而考试考的很差呢?

本质上就是他们的解题思维,严重过拟合到了练习题和模拟题上过拟合。说白了呀就是过分的穿凿,看到一点点相关类似的细节,就脑补了很多复杂的逻辑,使用一套非常复杂的方法来解决问题和给出答案。这就导致他们在过分的追求把练习题和模拟题都做全对。

在这个硬钻牛角尖的过程当中啊,把很多练习题里不严谨不合理的那些部分都当成了自己解题思维不可分割的一块这儿这样反而使得他们走火入魔。

8对于现实生活的指导意义

在现实生活中也有很多生动的过拟合的例子。比如说星座,你看那几个点的连线,就构想出大量复杂的细节,这就是标准的过拟合。

image-20250119210051527

再比如,我们的视觉系统对于人脸也有过拟合,只要看到的特征稍微有那些相似,你的大大脑就会因过过拟强烈的认为这有这是一张脸。有人脸特征;

image-20250119210122003

9.思考和启迪

总而言之,深理解解过拟合,在追求理解世界的道路上,你就拥有了一种重要的警惕。因此,千万不要追求那种所谓的什么,一切都是历史的必然。这样的说法,用一套看似言之凿凿的理论,解释过去。这就像某些人自以为是,自以为理解一切,说一切都在自己的解释之中的油腻中年人一样,其实就是在用一套过拟合的函数。马后炮的解释过去的数据而已。而你一旦将这套理论论于预预测未来,往往过错的离谱,学而不思则欠拟合,思而不学则过拟合

不要迷恋过分复杂的理论模型,不要苛求完美的解释,一切允许你的理论有些误差,是通往真理必要的代价。

标签:11,视频,这个,多项式,---,越差,拟合,考得,我们
From: https://blog.csdn.net/binhyun/article/details/145247864

相关文章

  • 【第一章】小程序中使用zebra-swiper实现复杂的3D轮播效果
    在现代前端开发中,轮播组件已成为内容展示的重要工具。虽然小程序提供了swiper组件用于实现简单轮播,但在复杂的轮播场景中往往无法得心应手。下面我将介绍一个基于uniapp的强大插件:zebraSwiper。相关链接ZebraSwiper官方文档https://swiper.zebraui.com/https://swiper.zeb......
  • Mysql--实战篇--@Transactional失效场景及避免策略(@Transactional实现原理,失效场景,内
    在Spring框架中,@Transactional注解用于声明式事务管理,能够简化事务的处理逻辑。然而,在某些情况下,@Transactional可能会失效,导致事务无法按预期工作。了解这些失效场景及其原因,可以帮助你更好地管理和调试事务问题。1、@Transactional失效的常见场景(1)、方法非public访问权......
  • SIP MESSAGE消息中的Content-Type
    TheContent-Typeheaderfieldindicatesthemediatypeofthemessage-bodysenttotherecipient.SIP消息中<Content-Type>消息头表示发送的消息体的媒体类型。如果消息体不为空,则必须存在Content-Type消息头。如果消息体为空且Content-Type消息头存在,则表示此类型的......
  • 微 语 --- 08
    世界不会因为你而难过,我们终将学会与自己好好相处。人们总说时间可以改变很多事,但事实上必须由你自己做出那些改变。开始一件事,可能是冲动。坚持一件事,绝对是本事。记住要仰望星空,不要低头看脚下。无论生活如何艰难,请保持一颗认真的心。只要你愿意走,路过的都是路,只要你不回避......
  • 【C】链表算法题2 -- 反转链表
    leetcode链接https://leetcode.cn/problems/reverse-linked-list/description/https://leetcode.cn/problems/reverse-linked-list/description/https://leetcode.cn/problems/reverse-linked-list/description/https://leetcode.cn/problems/reverse-linked-list/description/......
  • IO多路复用详解-select&poll&epoll
    目录1.IO多路复用概念2.系统调用函数2.1select2.1.1select函数细节2.2基于select实现并发处理2.2.1处理流程2.2.2服务端通信代码2.2.3客户端通信代码2.3基于poll函数实现并发处理2.3.1select与poll函数区别2.3.2poll函数2.3.3服务器端代码实现2.3.4客户端代码实......
  • 最新版Edge浏览器加载ActiveX控件技术——alWebPlugin中间件V2.0.30_alpha-春节版发布
     allWebPlugin简介   allWebPlugin中间件是一款为用户提供安全、可靠、便捷的浏览器插件服务的中间件产品,致力于将浏览器插件重新应用到所有浏览器。它将现有ActiveX控件直接嵌入浏览器,实现插件加载、界面显示、接口调用、事件回调等。支持Chrome、Firefox、Edge、360......
  • gorm - datatypes.JSONQuery 多种 JSON 查询方式
    一.官方:https://github.com/go-gorm/datatypes 二.modeltypeUserstruct{Name`gorm:"column:name;type:varchar(255);`Attributesdatatypes.JSON`gorm:"column:attributes;type:json"`}//数据内容user:=model.Us......
  • C++:PTA L1-086 斯德哥尔摩火车上的题
    L1-086斯德哥尔摩火车上的题上图是新浪微博上的一则趣闻,是瑞典斯德哥尔摩火车上的一道题,看上去是段伪代码:s=''a='1112031584'for(i=1;i<length(a);i++){if(a[i]%2==a[i-1]%2){s+=max(a[i],a[i-1])}}goto_url('www.multisoft.se/'+......
  • 1-1.Vue2 前端开发 - 富文本编辑器 wangEditor 引入
    一、富文本编辑器wangEditor1、富文本概述富文本(RichText)是一种包含丰富格式和样式的文本富文本不仅限于纯文字,还可以包含字体、颜色、大小、图片、链接、表格等多种元素与纯文本(PlainText)相比,富文本提供了更丰富的视觉和功能表现富文本的常见应用场景有:网页内......