首页 > 其他分享 >机器学习快速入门 第一阶段:基础名词

机器学习快速入门 第一阶段:基础名词

时间:2024-04-05 11:01:09浏览次数:24  
标签:函数 名词 梯度 回归 学习 第一阶段 代价 模型 入门

欢迎大家步入机器学习的大门,这是一门很有意思的课程,希望大家从了解到喜欢

最先了解的两个内容:

监督学习&非监督学习

监督学习和非监督学习是机器学习中两个非常重要的范式,它们各有特点和适用场景。

监督学习(Supervised Learning)

监督学习是一种机器学习方法,它在训练过程中利用已知的输入输出对(即带有标签的训练数据)来训练模型。训练完成后,这个模型将能够对新的、未见过的数据进行有效的预测或分类

特点:

  • 数据标签:每个训练样本都有一个已知的标签或结果,如图片的标签可能是“猫”或“狗”。
  • 目标导向:训练过程中明确目标,即最小化模型的预测值和真实值之间的差异。
  • 广泛应用:监督学习应用广泛,包括图像和语音识别、邮件过滤、预测分析等。

常见算法:

  • 线性回归
  • 逻辑回归
  • 支持向量机(SVM)
  • 决策树和随机森林
  • 神经网络

非监督学习(Unsupervised Learning)

非监督学习不同于监督学习,它不依赖于标注好的训练数据,而是直接对原始数据进行建模。非监督学习的目标是发现数据中的内在结构和模式

特点:

  • 无需数据标签:训练数据没有标签,也就是说,我们不知道每个样本的结果或分类。
  • 发现隐藏模式:非监督学习的目标是发现数据中的隐藏结构或模式,如将客户分为不同的群体。
  • 灵活性高:在没有明确任务目标的情况下,非监督学习可以探索数据,发现其中可能未知的有趣模式。

常见算法:

  • 聚类分析,如K-均值(K-means)算法
  • 主成分分析(PCA)
  • 自组织映射(SOM)
  • 层次聚类分析(Hierarchical clustering)

二者比较:

  • 数据要求:监督学习需要大量的标注数据,而非监督学习不需要。
  • 目标不同:监督学习旨在预测或分类,非监督学习旨在发现数据的内在结构。
  • 应用场景:监督学习适用于明确任务的情况,如分类或回归任务;非监督学习适用于数据探索,如用户细分或特征提取。

上文帮助大家更好地理解监督学习和非监督学习的区别和应用。


我们的第二项内容帮助大家了解机器学习入门的其他基础名词

入门第一阶段名词表:

线性回归模型实现梯度下降向量化多项式回归梯度下降实现
代价函数梯度下降的直观理解多元线性回归的梯度下降法Motivations过拟合的问题
代价函数的直观理解学习率特征缩放逻辑(logistic)回归解决过拟合
可视化代价函数线性回归中的梯度下降检查梯度下降是否收敛决策边界正则化代价函数
可视化的例子运行梯度下降学习率的选择逻辑回归的代价函数正则化线性回归
梯度下降多类特征特征工程逻辑回归的简化版代价函数正则化logistic回归

为了帮助大家更好地理解这些概念,我将以线性回归模型为起点,通过脉络连接这些内容,并对它们进行讲解。

1. 线性回归模型(Linear Regression Model)

线性回归是一种预测数值型数据的监督学习算法。它试图建立自变量(X)和因变量(Y)之间的线性关系,即 Y = mX + b,其中m是斜率,b是截距。

2. 代价函数(Cost Function)

代价函数(也称为损失函数)量化了模型预测值与实际值之间的差异。在线性回归中,常用的代价函数是均方误差(MSE)。

3. 代价函数的直观理解 & 可视化

代价函数的值越小,表示模型的预测值与实际值越接近。可视化代价函数通常会展示为一个二维或三维图形,显示不同参数值下代价函数的变化,帮助我们直观地理解如何通过调整模型参数来最小化误差。

4. 梯度下降(Gradient Descent)

梯度下降是一种优化算法,用于最小化代价函数。它通过迭代地调整参数,沿着代价函数的梯度下降的方向,逐步接近最小值。

5. 实现梯度下降 & 梯度下降的直观理解

在实现梯度下降时,关键在于计算代价函数关于每个参数的偏导数,以确定调整参数的方向和幅度。直观上,可以将其想象为一个球沿着山坡滚下来,最终稳定在最低点。

6. 学习率(Learning Rate)

学习率决定了在梯度下降过程中参数更新的步长。如果学习率过大,可能会导致超过最低点;如果过小,则收敛速度会非常慢。

7. 线性回归中的梯度下降

在线性回归中,梯度下降用于找到最佳的斜率和截距,以最小化代价函数。

8. 多元线性回归(Multivariate Linear Regression)

当有多个自变量时,线性回归模型可以扩展为多元线性回归。模型形式变为 Y = b + m1X1 + m2X2 + ... + mnXn。

9. 向量化(Vectorization) & 特征缩放(Feature Scaling)

向量化是一种编程技术,可以通过矩阵运算同时处理多个特征,从而提高计算效率。特征缩放如标准化或归一化,可以加快梯度下降的收敛速度。

10. 检查梯度下降是否收敛 & 学习率的选择

通过绘制代价函数值随迭代次数的变化曲线,可以检查梯度下降是否收敛。合适的学习率选择是一个试验和调整的过程。

11. 特征工程(Feature Engineering)

特征工程涉及到选择、修改或创建新的特征以提高模型的性能。多项式回归是特征工程的一个例子,它通过增加自变量的高次项来扩展模型。

12. 逻辑回归(Logistic Regression)

逻辑回归是一种用于二分类问题的监督学习算法。它

通过Sigmoid函数将线性回归的输出映射到0和1之间,以预测概率。

13. 决策边界(Decision Boundary) & 逻辑回归的代价函数

决策边界是逻辑回归中用来分隔不同类别的直线或曲线。逻辑回归的代价函数与线性回归不同,通常使用交叉熵损失函数。

14. 过拟合(Overfitting) & 解决方案

过拟合发生在模型过度复杂,以至于它在训练数据上表现得很好,但在新的、未见过的数据上表现差。解决过拟合的方法包括减少特征数量、获取更多数据或正则化。

15. 正则化(Regularization)

正则化是一种用于减少过拟合的技术,通过向代价函数中添加一个正则化项来惩罚过大的模型参数。正则化适用于线性回归和逻辑回归。

通过这个脉络,大家可以看到从基础的线性回归模型出发,如何通过代价函数和梯度下降这两个关键概念,逐步深入到模型优化、特征处理、到处理分类问题的逻辑回归,以及如何应对过拟合等高级问题。每个部分都是建立在前面内容的基础上,形成了一个连贯的学习路径。


好的,通过上面的学习,相信大家能够对机器学习的基础名词已经有所了解,现在我们通过两个小问题加深对于基础名词的了解!

问题1 :

目标:根据一些特征(如房屋大小、位置、房间数量等)来预测房价

我们通过十步走,将上面的名字放在问题之中

1. 数据收集:

首先,我们需要收集相关数据,这些数据包括房屋的特征和对应的价格。

2. 数据预处理:

这一步可能需要进行特征工程,比如选择相关的特征、创建新的特征(例如,从地理位置数据中提取特定区域)。

3. 选择模型:

假定我们选择线性回归模型来预测房价,因为我们预测的是一个连续的数值。

4. 定义代价函数:

我们需要一个代价函数来量化模型预测房价与实际房价之间的差异。在线性回归中,通常使用均方误差(MSE)作为代价函数。

5. 优化模型 - 梯度下降:

为了最小化代价函数,我们使用梯度下降算法来优化线性回归模型的参数。这个过程中,梯度下降的直观理解是我们在代价函数的曲面上寻找最低点。

6. 学习率选择:

在执行梯度下降时,选择合适的学习率至关重要,因为它决定了每一步我们向最低点迈进的距离。

7. 特征缩放:

如果我们的特征量纲差异很大,可能需要进行特征缩放,如归一化或标准化,以加快梯度下降的收敛速度。

8. 实施梯度下降:

使用编程实现梯度下降算法,不断更新模型参数直至代价函数收敛到最小值。

9. 模型评估:

通过测试集评估模型的性能,查看模型预测房价与实际房价之间的差异。

10. 过拟合检查与解决:

如果模型在训练集上表现很好,但在测试集上表现不佳,可能存在过拟合问题。此时,可以考虑使用正则化技术来减少过拟合。

通过这个流程,大家可以看到如何将这些概念串联起来解决一个实际问题。每一个步骤都有其特定的目的和作用,共同协作以建立、优化并评估预测模型。


问题2:

连续特征(如面积、楼龄)和分类特征(是否高价位):多元线性回归来处理连续特征;逻辑回归来处理分类预测

涉及到向量化、多项式回归以及决策边界

目标:基于一些特征(如面积、卧室数量、楼龄等)预测一套房子是否属于高价位区间。

1. 数据收集与预处理

首先,我们需要收集包含房屋特征和价格区间的数据。预处理阶段可能包括清理数据、处理缺失值、特征选择等。

2. 特征工程

  • 多元线性回归:考虑到房价可能受到多个因素的影响,我们可以使用多元线性回归模型来捕捉这些因素和房价之间的线性关系。
  • 多项式回归:如果某些特征与房价之间的关系更可能是非线性的,我们可以使用多项式回归来捕捉这种复杂的关系,如将面积的平方项作为一个新特征加入模型。

3. 向量化

为了提高计算效率,我们可以使用向量化的方式来表达和处理数据。这意味着将特征和参数表示为向量,使用矩阵运算来同时计算所有样本的预测值和梯度。

4. 逻辑回归

由于我们的目标是分类(是否高价位),因此我们需要使用逻辑回归模型。逻辑回归模型通过Sigmoid函数将线性回归的结果映射到0和1之间,表示概率。

5. 决策边界 & 逻辑回归的代价函数

  • 决策边界:在逻辑回归中,决策边界是用来区分不同分类的界线。模型训练完成后,我们可以通过设置阈值(通常是0.5)来确定这个界线,从而将预测概率转换为类别标签。
  • 代价函数逻辑回归使用的代价函数不同于线性回归。为了适应逻辑回归模型的输出特性(概率),通常使用交叉熵损失函数来量化模型的预测值与实际标签之间的差异。

6. 模型训练

使用梯度下降(或其他优化算法)来最小化逻辑回归的代价函数,不断更新模型的参数直到找到代价函数的最小值。

7. 模型评估

通过计算模型在测试集上的准确率、召回率、F1分数等指标来评估模型的性能,并可能使用混淆矩阵来直观展示模型的分类效果。

8. 过拟合检查与解决

如果模型在训练集上的表现远超过在测试集上的表现,可能存在过拟合现象。此时可以考虑增加更多的数据、减少特征的数量、使用正则化技术等方法来缓解过拟合。

问题2中的新名词解释:

  • 逻辑回归的代价函数——交叉熵损失函数:

    量化模型输出的预测概率分布与实际标签的真实分布之间的差异

    衡量两个概率分布的相似度,数值越小表示两个分布越相似

    用于提高学习效率,衡量预测的和真实的概率分布法相似度


好啦,我们机器学习入门的基础名词大家已经了解了,欢迎大家在评论区踊跃交流讨论,分享自己的学习心得与感悟!

也希望大家能够多多点赞收藏,这是对我更新最大的鼓励,我们下面继续机器学习入门的第二阶段:高级学习算法!!!

标签:函数,名词,梯度,回归,学习,第一阶段,代价,模型,入门
From: https://blog.csdn.net/wstwxl/article/details/137230085

相关文章

  • 机器学习快速入门 第二阶段:高级学习算法(1)
    第二阶段的高级学习算法课程包含58节,我按照相似度,将其分为九个模块,因篇幅较多,分成两个文章来讲,便于大家理解与掌握在本文中我们讲前四部分,目录如下:目录:神经网络的基础神经元和大脑 -这是对人工神经网络的生物学灵感来源的介绍。神经网络中的层 -详细介绍了神经网络中......
  • C++入门之项目实战——BMI指数计算
    前言本篇阅读之前,如果是新来的,请看看作者大大前面的文章。(别问我为什么,哈哈哈)实战什么是BMI?所谓BMI,是BodyMassIndex的缩写,即身体质量指数,是国际上常用的衡量人体肥胖程度的重要标准。BMI是通过我们人体体重与身高这两个数值来获取的,可有效评判一个人的健康营养状况。我......
  • 中间件 ZK分布式专题与Dubbo微服务入门 7-2 搭建maven工程,建立curator与zkserver的连
    0课程地址https://coding.imooc.com/lesson/201.html#mid=12839 1重点关注1.1本节内容使用curator建立和zkServer的连接java用法STS搭建maven工程 1.2关键代码/***同步创建zk示例,原生api是异步的,推荐第1,2种写法......
  • 字符串函数【超级详细版】(入门必看!!!)
    字符串函数【超级详细版】(入门必看!!!)1.strlen的使用和模拟实现1.1strlen的使用1.2strlen的模拟实现2.strcpy的使用和模拟实现2.1strcpy的使用strcpy的模拟实现3.strcat的使用和模拟实现3.2strcat的模拟实现4.strcmp的使用和模拟实现4.1strcmp的使用4.2strcmp......
  • STM32入门篇(LED、蜂鸣器和面包板简介)
    LED·LED:发光二极管,正向通电点亮,反向通电不亮·引脚长的一端为正极,短的一端为负极·以下两张图,是用STM32GPIO口驱动LED灯 R1作用:①防止LED因为电流过大而烧毁 ②调整LED的亮度           低电平驱动的电路(低点亮)      ......
  • 数据结构——从入门到飞升——两个有序链表的交集
    题目:已知两个非降序链表序列S1与S2,设计函数构造出S1与S2的交集新链表S3。输入格式:输入分两行,分别在每行给出由若干个正整数构成的非降序序列,用−1表示序列的结尾(−1不属于这个序列)。数字用空格间隔。输出格式:在一行中输出两个输入序列的交集序列,数字间用空格分开,结尾不能有......
  • 第6天:基础入门-抓包技术&HTTPS协议&APP&小程序&PC应用&WEB&转发联动
    第六天一、抓包技术-HTTP/S-Web&APP&小程序&PC应用想要抓包都必须要配置代理和端口,这些工具只能抓取HTTP/S协议的数据,走其他协议的数据抓不了有些APP具有代理检测功能,若发现你开启了代理,直接无法访问APP1.Web网页:安装完抓包软件之后,需要在软件上导出CA证书,在浏览器上......
  • CTFshow web入门 爆破
    web21随便输入一个账号密码发现是base64调一下设置先clear了再添加要爆破的部分由于那一段分不开所以设置头为admin密码为shark63,账号一般为admin所以不用管(我用的不好,别人直接出来了我得这样子才行,将就着看)web22域名失效了,看的wp很细节,在子域名里面有flagweb23......
  • ctfshow web入门 php特性 web89--web107
    web89看到有intval函数这里建议先观看一篇博客好绕过https://blog.csdn.net/wangyuxiang946/article/details/131156104?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171220387216800197044297%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%......
  • Python八字教程1简介&快速入门
    1简介&快速入门1.1简介https://github.com/china-testing/bazi是基于Python的八字排盘工具。它清晰看出冲刑合会、阴阳等关系,并有凝聚大师多年经验的评判。另有合婚、风水等功能。是目前市面功能最强大的免费开源八字排盘工具,适合具有编程基础者在电脑上使用。1.1.1帮助pyt......