根据数据类型的不同,对一个问题的建模可以有不同的方式,在机器学习或人工智能领域,人们首先会考虑算法的学习方式,在机器学习领域主要有以下几种重要的学习方式:
1.监督式学习,在监督式学习中,输入的数据被称为”训练数据“,每组训练数据都有一个明确的标识或结果,如对防垃圾邮件系统中的”垃圾邮件“、”非垃圾邮件“,对手写数字识别中的1,2,3,4等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与”训练数据“的实际结果进行比较,不断地调整预测模型,直到模型的预测结果达到一个预期的准确率。
2.非监督式学习,在非监督式学习下,数据并不被特别标识,学习模型是为了推断出数据的一些内在结果。常见的应用场景包括关联规则的学习及聚类等。
3.半监督式学习,在半监督式学习下,输入数据部分被标识,部分没有被标。这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构,以便合理地组织数据进行预测。
4.在强化学习下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅作为一种检查模型对错的方式。在强化学习下,输入数据直接反馈到模型,模型必须对此立刻做出调整。
在企业数据应用的场景下,人们最常用的可能就是监督式学习和非监督式学习。在图像识别领域,由于存在大量的非标识数据和少量的可标识数据,目前半监督式学习是一个很热门的话题,而强化学习更多地应用在机器人控制及其他需要进行系统控制的领域。