这是美国爱荷华州立大学工业工程系王立志老师联合同校老师发表的一篇文章。Front. Plant Sci.虽然影响因子不高(大家应该都知道偏应用的数量遗传学发表的期刊普遍不高),但本文的引用还是蛮高的,好像是年度最佳论文之一吧。
本文介绍了一种基于深度学习的框架,用于预测作物产量。该框架结合使用卷积神经网络(CNN)和循环神经网络(RNN),利用环境数据和管理实践来预测玉米和大豆的产量。与其他流行方法相比,如随机森林、深度全连接神经网络和LASSO,该模型在预测准确度上表现更佳。该模型具有三个显著特点:能够捕捉环境因素和种子遗传改良的时间依赖性,无需基因型信息;能够在未测试环境中进行泛化,不会显著降低预测准确性;可以与反向传播方法结合,揭示天气条件、天气预报精度、土壤状况和管理实践对作物产量变化的影响程度。
模型地址:https://github.com/saeedkhaki92/CNN-RNN-Yield-Prediction
作者简介:
王立志,博士,副教授。2003年获得中国科技大学自动化专业工学学士学位和管理科学专业理学学士双学位,2007年获得美国匹兹堡大学工业工程专业博士学位,现任美国爱荷华州立大学工业工程系副教授。主要研究方向包括优化机器学习算法设计以及在多个领域的广泛应用,包括农业,能源,交通,制造业,等等。在国际期刊发表50多篇论文,获得超过1400多万美元的研究经费,包括美国自然科学基金,美国农业部,美国国防部,美国国土安全部,与先正达(Syngenta),科迪华(Corteva),巴斯夫(BASF)等多家公司有长期密切的合作关系。率领研究团队在2018,2019,和2020年先正达作物挑战竞赛(Syngenta Crop Challenge)中分别获得第三名,第二名,和第一名的成绩。研究团队近年来发表一系列基于机器学习和优化算法的基因组选择技术,并且在与多家育种公司的合作中获得初步成功。近期目标致力于把算法推广到更多的植物和动物育种实践中,并对算法进行不断更新改进。
论文方法
方法描述
该研究使用了CNN、全连接层和RNN三种模型来预测作物产量。其中,W-CNN和S-CNN分别用于捕捉天气数据和土壤数据的线性和非线性效应;FC将W-CNN和S-CNN提取出的高阶特征组合起来,并降低输出维度;而RNN则通过LSTM单元来捕捉多年中作物产量的时间依赖关系。此外,该研究还采用了历史平均产量数据作为输入,以使模型能够利用历史趋势进行预测。
方法改进
采用了多种数据预处理技术,如网格地图法、均值填充等,以提高模型的准确性。同时,他们还尝试了其他插补技术,并发现均值方法是最准确的。
解决的问题
旨在预测美国玉米和大豆的产量,以帮助农民更好地规划种植策略。由于没有公开发布的基因型数据可用,因此该研究使用了历史产量数据和其他环境因素的数据来进行预测。这种方法可以为农业生产提供更精确的指导,从而提高农作物的产量和质量。
论文实验
本文介绍了作者在农业领域中使用深度学习模型预测玉米和大豆产量的实验。实验中,作者比较了四种不同的预测模型,并分析了它们在不同方面的表现。
首先,作者采用了随机森林(Random Forest)、深度全连接神经网络(Deep Fully Connected Neural Network)和最小绝对收缩和选择运算符(Lasso)等三种流行的预测模型来进行比较。通过对这三种模型的表现进行评估,作者发现这些传统的线性模型无法捕捉到土壤和天气数据中的非线性效应,因此不能很好地预测作物产量。
接着,作者提出了一个基于卷积神经网络和循环神经网络的混合模型(CNN-RNN),并将其与其他三种模型进行了比较。实验结果表明,CNN-RNN模型在所有方面都表现出色,比其他三个模型更准确地预测了玉米和大豆的产量。作者认为,这是因为CNN-RNN模型能够同时考虑遗传改进、内部时间依赖关系和空间依赖关系等因素的影响。
此外,作者还对模型进行了特征选择分析,以确定每个因素对产量的重要性。通过这种方法,作者发现了许多关键时期对于作物产量的影响,并进一步解释了如何利用这些信息来改善农业生产。
最后,作者还研究了模型的泛化能力,即在未经过训练的新地点上进行预测的能力。实验结果显示,CNN-RNN模型在新地点上的预测准确性与在已知地点上的预测准确性相当,说明该模型具有较强的泛化能力。
综上所述,本文介绍了作者在农业领域中使用深度学习模型预测作物产量的实验,并通过对不同模型的比较和分析,证明了CNN-RNN模型在预测精度和泛化能力等方面的优势。`
论文总结
文章优点
- 该研究使用深度学习模型对玉米和大豆产量进行了预测,并成功地将其应用于美国中西部地区。
- 研究采用了卷积神经网络(CNN)和循环神经网络(RNN)相结合的方法,以捕捉环境数据和土壤数据的影响因素。
- 研究人员还通过特征选择方法解释了模型的结果,为更好地理解模型提供了帮助。
方法创新点
- 该研究使用了CNN和RNN相结合的深度学习模型,以更准确地预测作物产量。
- 研究人员还开发了一种特征选择方法,可以解释模型的结果并提高可解释性。
未来展望
- 这项研究为进一步探索农业领域中的深度学习应用提供了有价值的参考。
- 未来的研究可以考虑将其他因素纳入模型,如气候变化等,以提高预测准确性。