分类
含义:标识对象的所属类别
类别:监督学习
算法:SVM、KNN、随机森林、决策树、贝叶斯
回归
含义:预测与对象关联的连续值属性
类别:监督学习
算法:SVR、KNN、随机森林、随机梯度下降、多项式回归、logistic回归
聚类
含义:自动将相似对象归为一组
类别:无监督学习
算法:K-均值、谱聚类、MeanShift
降维
含义:减少要考虑的随机变量的数量
类别:预处理
算法:PCA(主成分分析:可以对数据进行线性变换,同时降低数据的维数并保留大部分可解释的方差。64x64像素的灰度图像,数据的维数为4096,通过PCA降维至200维)
ICA(独立成分分析将一个多元信号分解成独立性最强的可加子成分。通常,ICA不用于降低维度,而是用于分离叠加信号。)
模型选择
含义:比较、验证和选择参数及模型
应用:通过参数调整改进模型精度
算法:网格搜索、交叉验证、指标和评分(准确度、精确度、召回率、f1值)、混淆矩阵
预处理
含义:特征提取和归一化
应用:转换输入数据,例如文本,以供机器学习算法使用
算法:标准化(映射为均值为0、方差为1)、归一化(去量纲)、离散化(将连续特征划分为离散值的方法)、插补缺失值
集成
含义:
标签:机器,含义,学习,算法,总章,随机,归一化,类别 From: https://www.cnblogs.com/pass-ion/p/17008881.html