本文所有内容整理自网络。完整内容可以点击这里获取:完整资料下载地址
前言
分类和回归是数据挖掘和机器学习中常见的两个预测问题。
分类算法
分类算法是拟合一个模型或函数的过程,该模型或函数有助于将数据分为多个类别,即离散值。在分类中,根据输入中给定的一些参数,数据被分类到不同的标签下。
- 在分类任务中,我们应该使用独立特征来预测离散的目标变量(类别标签)。
- 在分类任务中,我们需要找到一个决策边界,可以将目标变量中的不同类别分开。
得到的映射函数可以用“IF-THEN”规则的形式来展示。分类任务处理的问题中,数据可以被划分为二分类或多个离散标签的情况。让我们举一个例子,假设我们想要根据历史记录中的参数来预测A队在比赛中获胜的可能性。那么会有两个标签,即是和否。
二分类和多分类示意图
常见的分类算法
随着机器学习研究人员的努力,已经开发出了不同类型的分类算法,并可以通过bagging和boosting等技术来提高分类任务的性能。
- 逻辑回归
- 决策树
- 随机森林
- K近邻
- 支持向量机
回归算法
回归是寻找一个模型或函数的过程,用于将数据区分为连续的实数值,而不是使用类别或离散值。它还可以根据历史数据识别分布的变化。
- 在回归任务中,我们应该使用独立特征来预测连续的目标变量。
- 在回归任务中,通常会遇到线性回归和非线性回归这两种类型的问题。
让我们也举一个回归任务的例子:我们根据历史记录的参数来预测特定地区的降雨可能性。然后与降雨相关联的是一个概率值。
回归算法示意图
常见的回归算法
回归算法也可以通过bagging和boosting等技术来提高回归任务的性能。
- 线性回归
- Lasso回归
- Ridge回归
- XGBoost回归
分类算法和回归算法的比较
写在最后
小伙伴们记得“点赞、收藏、关注”三连,随时查看。
标签:机器,一文,标签,回归,分类,任务,离散,算法 From: https://blog.51cto.com/u_16245388/7438518