带你从入门到精通——机器学习（一. 机器学习概述）

强化学习（Reinforcement Learning，RL）是机器学习的一个子领域，在RL中，智能体不断与环境进行交互，通过不断试错的方式来获得最佳策略，主要包含四个元素：智能体（Agent），环境（Environment），动作（Action），奖励（Reward），最终目的是最大化累计奖励（即每一个时间步所获得的奖励总和），具体图示如下：

四种机器学习算法的总结如下：

1.6 机器学习的建模流程

机器学习的建模流程主要分为以下五步：

获取数据：搜集整理与机器学习任务相关的各种数据集。

数据预处理：对数据中异常值、缺失值的处理等。

特征工程：对数据特征进行处理，最终转成为特征向量，让模型达到最好的预测效果。

机器学习（模型训练）：选择合适的算法对模型进行训练，需要根据不同的任务来选取不同的算法。

模型评估：评估模型的最终预测效果，如果评估效果好则上线服务，评估效果不好则重复上述步骤。

1.7 特征工程

利用专业背景知识和技巧处理数据，让机器学习算法效果最好，这个过程就是特征工程，特征工程通常是困难的、耗时的，是机器学习开发中的主要工作。数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。

特征工程主要分为以下五步：

特征提取：原始数据中提取与任务相关的特征，构成特征向量。

特征预处理：对特征进行归一化、标准化等处理，保证各特征对模型影响相同。

特征降维：将原始数据的维度降低，叫做特征降维，特征降维会原始数据产生影响，往往会丢失部分信息，但是会保留最主要的信息。

特征选择：从特征中根据一些指标选择出一些重要特征就是特征选择，特征选择不会改变原始数据。

特征组合：特征组合是指把多个的特征合并成一个特征，可以通过加法、乘法等方法将特征值合并。

1.8 模型的拟合

在机器学习领域，拟合（fitting）通常用来表示模型对样本点的接近情况。

如果模型在训练集上表现很差，同时在测试集表现也很差，这种情况被称为欠拟合（under-fitting），主要原因是模型过于简单。具体表现为模型学习到的特征过少，导致模型无法准确的预测未知样本，可以通过增加特征的方式，来增加模型的复杂度，进而解决欠拟合。

如果模型在训练集上表现很好，但是在测试集表现很差，这种情况被称为过拟合（over-fitting），主要原因是模型太过于复杂、数据不纯、训练数据太少等等。具体表现为模型学习到的特征过多，导致模型只能在训练样本上得到较好的预测结果，而在未知样本上的效果不好，可以通过正则化、异常值检测、特征降维等方法来解决过拟合问题。

出现过拟合的模型，往往泛化能力较差，泛化能力是指模型在新数据集（非训练数据）上上表现良好的能力。

1.9 奥卡姆剃刀原则

奥卡姆剃刀原则是指给定两个具有相同泛化误差（即模型在未见过的新数据上的预测误差）的模型，较简单的模型比较复杂的模型更可取。

可以用这句话来概况奥卡姆剃刀原则：如无必要，勿增实体。

标签：机器,入门,特征,模型,学习,算法,数据
From： https://blog.csdn.net/2401_86480334/article/details/144671533

带你从入门到精通——机器学习（一. 机器学习概述）

一. 机器学习概述

1.1 人工智能三大概念

1.2 算法的学习方式

1.3 人工智能的发展史和三要素

1.3.1 人工智能的发展史

1.3.2 AI发展的三要素

1.4 机器学习常见术语

1.5 机器学习算法的分类

1.5.1 有监督学习

1.5.2 无监督学习

1.5.3 半监督学习

1.5.4 强化学习

1.6 机器学习的建模流程

1.7 特征工程

1.8 模型的拟合

1.9 奥卡姆剃刀原则

相关文章

赞助商

阅读排行