首页 > 其他分享 >一文了解机器学习中分类和回归的差异

一文了解机器学习中分类和回归的差异

时间:2023-08-20 12:00:46浏览次数:111  
标签:机器 一文 回归 分类 任务 离散 算法 预测

前言

分类和回归是数据挖掘和机器学习中常见的两个主要预测问题。

分类算法

分类算法是拟合一个模型或函数的过程,该模型或函数有助于将数据分为多个类别,即离散值。在分类中,根据输入中给定的一些参数,数据被分类到不同的标签下。

  • 在分类任务中,我们应该使用独立特征来预测离散的目标变量(类别标签)。

  • 在分类任务中,我们需要找到一个决策边界,可以将目标变量中的不同类别分开。

得到的映射函数可以用“IF-THEN”规则的形式来展示。分类任务处理的问题中,数据可以被划分为二分类或多个离散标签的情况。让我们举一个例子,假设我们想要根据历史记录中的参数来预测A队在比赛中获胜的可能性。那么会有两个标签,即是和否。

常见的分类算法

随着机器学习研究人员的努力,已经开发出了不同类型的分类算法,并可以通过bagging和boosting等技术来提高分类任务的性能。

  • 逻辑回归

  • 决策树

  • 随机森林

  • K近邻

  • 支持向量机

回归算法

回归是寻找一个模型或函数的过程,用于将数据区分为连续的实数值,而不是使用类别或离散值。它还可以根据历史数据识别分布的变化。

  • 在回归任务中,我们应该使用独立特征来预测连续的目标变量。

  • 在回归任务中,通常会遇到线性回归和非线性回归这两种类型的问题。

让我们也举一个回归任务的例子:我们根据历史记录的参数来预测特定地区的降雨可能性。然后与降雨相关联的是一个概率值。

 

常见的回归算法

回归算法也可以通过bagging和boosting等技术来提高回归任务的性能。

  • 线性回归

  • Lasso回归

  • Ridge回归

  • XGBoost回归

分类算法和回归算法的比较

  分类
回归
1 目标变量是离散的 目标变量是连续的
2 垃圾邮件分类、疾病预测 房价预测、降雨量预测
3 在这个场景中,我们试图找到可能的最佳决策边界,以实现两个类别之间的最大可能分离 在这个场景中,我们试图找到最佳拟合线,以表示数据的总体趋势
4 使用评估指标如精确率(Precision)、召回率(Recall)和 F1 值(F1-Score)来评估分类算法的性能 使用评估指标如均方误差(Mean Squared Error)、R2 分数(R2-Score)和平均绝对百分比误差(MAPE)来评估回归算法的性能
5 可以分为二分类和多分类等 可以分为线性回归和非线性回归等
6 输出是分类变量 输出是连续变量

 

 写在最后

小伙伴们记得“点赞、在看、关注”三连,随时查看。

《BAT机器学习面试1000题》资料获取方式:第1步:打开微信搜索:1号程序员,并关注。第2步:在对话框中输入:E001,即可获取资源下载地址。

 

标签:机器,一文,回归,分类,任务,离散,算法,预测
From: https://www.cnblogs.com/sqchi1991/p/17643811.html

相关文章

  • 解读HTML-入门第一文
    (HTML详细解读)概念解读HTML(HypertextMarkupLanguage)是一种用于创建网页的标记语言。作为互联网的基础,HTML在网页设计与开发中起着至关重要的作用。对于任何一个想要深入了解网页制作的人来说,掌握HTML的知识是必不可少的。本篇文章旨在帮助==小程的所有小伙伴们==更好地理解和......
  • MacbookPro 17年款老机器升级Macos10.15.7挺好的
    MacbookPro17年款老机器升级Macos10.15.7挺好的由于需要安装一些软件,至少需要10.14或者10.15,所以,把MacBookPro17年款的老机器进行了升级,原装的系统是10.12.6.安装之前在网上搜索了各种升级的利弊,有升级成功的,也有很多说升级之后不能使用,然后又降级的。搞得犹豫了好一会,最后还......
  • python机器学习经典算法代码示例及思维导图(数学建模必备)
    最近几天学习了机器学习经典算法,通过此次学习入门了机器学习,并将经典算法的代码实现并记录下来,方便后续查找与使用。这次记录主要分为两部分:第一部分是机器学习思维导图,以框架的形式描述机器学习开发流程,并附有相关的具体python库,做索引使用;第二部分是相关算法的代码实现(其实就是......
  • 【Verilog】一文带你了解verilog基础语法
    Verilog很简单,always..if..else走天下。——鲁迅前言虽说verilog很简单,简单到always..if..else走天下。但是也会有不知道怎么写代码的尴尬场景。代码也写了不少了,回过头来,再来继续学习Verilog,整理再出发!大概思路:基础语法——高级语法——Verilog题目——典型电路——常用模......
  • 机器学习实践:用户新增预测
    开始分析根据海量的应用数据作为训练样本,基于提供的样本构建模型,预测用户的新增情况。赛题数据由约62万条训练集、20万条测试集数据组成,共包含13个字段。其中uuid为样本唯一标识,eid为访问行为ID,udmap为行为属性,其中的key1到key9表示不同的行为属性,如项目名、项目id等相关字段,common......
  • 基于机器学习的基因组预测
    目录机器学习与GP基因型数据编码高通量表型数据驱动的育种需要结构化数据集可解释机器学习机器学习与GP与动物育种相比,植物的基因组选择必须通过环境相互作用来考虑更大的基因型,并且需要添加适当的多环境试验数据。机器学习(ML)和深度学习(DL)算法比线性预测模型更复杂,可以发现......
  • AI聊天机器人原来有这么多作用
    AI聊天机器人是一种能够模拟人类对话并利用人工智能技术进行自主学习和适应的计算机程序。它们能够根据用户的输入内容来分析用户的需求,并提供相应的回答和建议。今天looklook就来和大家详细讲一下AI聊天机器人到底有什么作用吧。AI聊天机器人的作用1、客户服务:AI聊天机器人可以作......
  • 一文带你读懂设计模式之责任链模式
    1.前言emm,翻了一下之前刚入职时候的学习笔记,发现之前在熟悉业务代码的时候曾经专门学习并整理过过设计模式中的责任链模式,之前只是对其简单了解过常用的设计模式有哪些,并未结合实例和源码深入对其探究,利用熟悉代码契机进行系统学习并整理文档如下。2.什么是责任链模式?俗话说没......
  • 吴恩达机器学习2011版本学习笔记
    这是看完视频后,按自己的理解做了笔记。监督学习学的比较认真,33之后的无监督学习心态已经浮躁了,以后要再学一遍2022最新版视频课。1,有正确答案是有监督学习,反之是无监督学习2,模型就是把训练数据拟合为一个公式(严格来说是个函数,关系)。入门的拟合的方法是最小二乘法,先假设一个公式,......
  • 一文读懂LockSupport
    阅读本文前,需要储备的知识点如下,点击链接直接跳转。java线程详解Java不能操作内存?Unsafe了解一下LockSupport介绍搞java开发的基本都知道J.U.C并发包(即java.util.concurrent包),所有并发相关的类基本都来自于这个包下,这个包是JDK1.5以后由祖师爷DougLea写的,LockSupport也是在这......