1、机器学习是干什么的。我的理解:通过查看现在的状况,利用机器学习,预测未来可能出现的情况。(房价预测)/或者说通过一些算法、代码让机器实现一些简单的工作。(客服机器人) 编写算法,让机器人通过大量的数据、经验自己学习获得最优解。
2、机器学习的分类:
监督学习:经验E是人工采集并输入计算机中的。
分为传统监督学习(每个训练数据都有对应的标签)、非监督学习(所有训练数据都没有对应的标签)、半监督学习三种。
另一个角度分类(基于标签的固有属性):分类(标签是离散的值)和回归(标签是连续的值)(训练样本是时间、标签是房价,房价是连续的) 房价看成10000、100001、100002。这样就是离散的。房价化成一个曲线,就是连续的。
监督学习算法:支持向量机、深度神经网络、人工神经网络。
无监督学习算法:聚类、EM算法、主成分分析。
强化学习:经验E是由计算机与环境的互动获得的。计算机产生行为并获得这个行为的结果。我们只需设计收益函数。同时设计算法,让计算机自己改变自己的行为模式,去最大化收益函数。
3、机器学习的流程:
①把一个问题变成机器学习的问题 ②收集数据、处理数据、提取特征(通过训练样本取得对机器学习任务有帮助的多维数据) ③训练模型,通过这些数据,设计模型,使得我的模型能预测未来的数据 ④关注模型的性能,通过模型获得新数据,再用新的数据进行模型的调整。 迭代这一过程。
选择什么样的问题 变成机器学习的问题呢? ----- 利益。
数据的选择? ---- 高质量的、清洗过的数据。
模型的设计和上线?----- 设计模型需要大量的机器来跑数据。 设计了模型还不一定能用,可能部署上线很贵。
1、对数据进行特征提取、特征选择。2、使用不同的算法对特征空间做不同的划分获得不同的结果 3、研究不同场景下采用哪种算法。
标签:机器,标签,模型,学习,算法,数据 From: https://www.cnblogs.com/bhd123/p/17242166.html