机器学习就是让计算机来学习,程序员只编写负责学习的程序,然后让计算机进行大量的数据读取,通过分析特征,生成识别模型也就是识别机制。
有监督学习就是给计算机带去大量带有正确答案的数据,此刻正确答案就相当于监督者,有监督学习,适用于数字识别领域的分类问题。而实现步骤就是准备大量的学习数据和正确答案划分成训练数据和测试数据,然后使用训练数据通过学习算法让计算机生成模型,学习算法也被叫做学习器,而生成的模型叫做分类器,最后使用测试数据对分类器进行评估即可,符合要求就可以对新数据进行检测。
机器学习常用的编程语言时Python,因为它包含了机器学习相关功能的库。Python有两种运行程序的方法,一种使用Python解释器对事先编写好的源代码进行解释执行的脚本模式,另一种是直接启动Python解释器,通过键盘逐行输入程序并解释执行的交互模式。
机器学习总结有三个步骤(1)将学习数据和答案数据划分为训练数据和测试数据(2)用学习算法学习训练数据并生成模型(3)用测试数据评估模型的性能。
交叉验证是一种不断轮换训练数据和测试数据来进行机器学习的方法。这样可以检测学习木星的识别率是否存在因学习数据的类型而出现偏差的情况。