Task01 打卡西瓜书南瓜书第一二章

时间：2024-09-18 13:54:27浏览次数：13

第一章绪论

基本概念：
- 机器学习：研究计算机从数据中产生“模型”的算法——“学习算法”。
- 深度学习：指神经网络类算法，是机器学习的一个子集。
- 算法：从数据中学习得出模型的具体方法。
- 模型：算法产出的结果，通常是具体的函数或可抽象看作函数。
- 假设：学得模型对应了关于数据的某种潜在的规律。
- 真相：潜在规律自身。
基本术语：
- 数据集：样本的集合。
- 样本（示例）：一个事件或对象的描述。
- 属性（特征）：反映事件或对象在某方面表现或性质的事项。
- 属性值：属性的取值。
- 属性空间（样本空间、输入空间）：属性张成的空间。
- 特征向量：属性空间中的每一个点对应一个坐标向量。
- 学习（训练）：从数据中学得模型的过程。
- 训练数据：训练过程中使用的数据。
- 标记（label）：示例结果的信息。
- 监督学习：训练数据有标记信息——分类、回归是代表。
- 无监督学习：训练数据没有标记信息——聚类是代表。
发展历史：
- 从20世纪50年代到21世纪，机器学习经历了从推理期、知识期、符号主义学习、连接主义学习到统计学习的发展过程，并最终迎来了深度学习的崛起。
NFL定理：
- 机器学习算法没有免费的午餐（No Free Lunch Theorem），即众算法生而平等，要谈论算法的具体优劣，必须要针对具体的学习问题。

第二章模型评估与选择

经验误差与过拟合：
- 错误率：分类错误的样本数占样本总数的比例。
- 精度：1-错误率。
- 误差：预测值与真实值之间的差异。
- 训练误差（经验误差）：学习器在训练集上的误差。
- 过拟合：学习器过于复杂，把训练样本自身的一些特点当做了所有潜在样本都会有的一般性质，导致泛化误差大。
- 欠拟合：学习器过于简单，对训练样本的一般性质尚未学好，训练误差和泛化误差都很大。
评估方法：
- 留出法：直接将数据集划分为训练集和测试集，用测试集评估模型的误差。
- 交叉验证法：将数据集划分为k个大小相似的互斥子集，进行k次训练和测试，最终返回k个测试结果的均值。
- 自助法：通过自助采样法产生训练集和测试集，用于模型评估。
性能度量：
- 错误率和精度：适用于二分类和多分类任务。
- 查准率、查全率、F1：分类任务中常用的性能度量。
- P-R曲线：将样本依据其是正例的可能性依次将其作为正例计算出查全率和查准率，绘制出的曲线。
- 平衡点（BEP）：查全率=查准率时的取值。
- F1：查准率和查全率的调和平均。

第一章首先为我们勾勒了机器学习的全貌，从基本概念、发展历程到当前的研究热点，让我对机器学习这一领域有了整体的认识。这种宏观视角的建立。

第二章详细介绍了模型评估的几种基本方法，包括留出法、交叉验证法和自助法。这些方法不仅为我提供了评估模型性能的工具，还让我理解了不同方法之间的优缺点和适用场景。理解了过拟合与欠拟合的概念，本章还介绍了多种性能度量指标，如错误率、精度、查准率、查全率、F1分数等。这些指标为我提供了评估模型性能的多维度视角，使我能够更全面地了解模型的优缺点，并据此进行有针对性的优化。

标签：误差,第一二,训练,模型,学习,算法,Task01,打卡,查准率
From： https://blog.csdn.net/m0_74851616/article/details/142330891

打卡信奥刷题（773）用Scratch图形化工具信P5737[普及组/提高组] 【深基7.例3】闰年展示
【深基7.例3】闰年展示题目描述输入x,yx,yx,y，输出[......
LeeCode打卡第二十八天
LeeCode打卡第二十八天第一题：路径总和II（LeeCode第437题）:给定一个二叉树的根节点root，和一个整数targetSum，求该二叉树里节点值之和等于targetSum的路径的数目。路径不需要从根节点开始，也不需要在叶子节点结束，但是路径方向必须是向下的（只能从父节点到子节点）。解法......
打卡信奥刷题（771）用Scratch图形化工具信P5727[普及组/提高组] 【深基5.例3】冰雹猜想
【深基5.例3】冰雹猜想题目描述给出一个正整数nnn，然后对这个数字一直进行下面的操作：如果这个数字是奇数，那么将其乘3......
打卡信奥刷题（769）用Scratch图形化工具信P5722[普及组/提高组] 【深基4.例11】数列求和
【深基4.例11】数列求和题目描述计算1+2+3+⋯......
打卡信奥刷题（761）用Scratch图形化工具信奥P5713[普及组/提高组] 【深基3.例5】洛谷团队
【深基3.例5】洛谷团队系统题目描述在洛谷上使用团队系统非常方便的添加自己的题目。如果在自己的电脑上配置题目和测试数据，每题需要花费时间555分钟；而在洛谷团队中上......
图论篇--代码随想录算法训练营第五十九天打卡|Bellman_ford 算法精讲，SPFA算法，Bellman
本系列算法用来解决有负权边的情况Bellman_ford算法精讲题目链接：94.城市间货物运输I题目描述：某国为促进城市间经济交流，决定对货物运输提供补贴。共有n个编号为1到n的城市，通过道路网络连接，网络中的道路仅允许从某个城市单向通行到另一个城市，不能反向通行。网络......
（Linux）嵌入式打卡第十一天
指针数组简介概念：指针数组的本质是一个数组，只不过数组里面的每一个元素都是指针；定义格式：数组类型*数组名[成员个数];eg://定义一个数组，数组里面的每一个元素都是int*类型int*arr[5];指针数组使用#include<stdio.h>intmain(int......
这个桌面日历真不错笔记提醒生日记录打卡翻译都有真的太方便了！
这个桌面日历真不错笔记提醒生日记录打卡翻译都有真的太方便了！日历产品非常的多，如何选择一个合适自己的桌面日历，这个很重要，今天小编给大家介绍这个芝麻日历，一起看下它有些什么功能，是不是你需要的。1、美观，一个实用的桌面日历，不仅要界面美观，还要功能强大；芝麻日历（https:/......
LeeCode打卡第二十四天
LeeCode打卡第二十四天第一题：对称二叉树（LeeCode第101题）:给你一个二叉树的根节点root，检查它是否轴对称。/***Definitionforabinarytreenode.*publicclassTreeNode{*intval;*TreeNodeleft;*TreeNoderight;*TreeNode(){......
今日打卡：洛谷：P1248 加工生产调度/P1251 餐巾计划问题
昨天虽然打了卡，但是因为时间问题，所以没做题，今天补回来。今天的运势也真服了，我今天没出过门，也不会装逼啊！还有，我不开电脑怎么做题啊？请教问题也找不到人啊！P1248加工生产调度：#include<bits/stdc++.h>usingnamespacestd;structnumber{ intnum,ind; boolsign; boolo......

Task01 打卡西瓜书南瓜书第一二章

第一章绪论

第二章模型评估与选择

相关文章

赞助商

阅读排行

Task01 打卡 西瓜书南瓜书第一二章

第一章 绪论

第二章 模型评估与选择

相关文章

赞助商

阅读排行

Task01 打卡西瓜书南瓜书第一二章

第一章绪论

第二章模型评估与选择