文章目录
1 标准数据集的滥用
1.1 机器学习不研究采集数据
驱动AI发展的三驾马车——数据+算法+算力,其中的“数据”之所以要单独列出来,是因为机器学习不研究怎样采集数据。
基本的科学研究过程:
标准数据集的广泛使用就让机器学习研究缺失了一环——数据采集,机器学习研究人员也没有觉得有什么不对的地方。这样,科学研究的第一个步骤——科学观察,离开了机器学习的研究范围。
在科学研究中,科学家是基于什么原因、在科学观察中采集特定的数据,机器学习领域此后就基本上没有相关研究了。机器学习教科书一般也都回避数据的来源问题,基本都着力在如何处理数据。
标准数据集的广泛使用,使得越来越多的机器学习研究人员聚焦于算法研究,这已经成为今天机器学习的主流研究模式。
1.2 基于别人采集的数据学习
这样,机器学习研究人员只好使用“别人采集的数据”去研究算法。
然而,“别人采集的数据”,并不是机器学习研究人员想象的那么“美好”。
标签:Iris,38,机器,ML,学习,采集,2.2,数据 From: https://blog.csdn.net/qq_20466211/article/details/143746669