题目“Predicting the performance of green stormwater infrastructure using multivariate long short-term memory (LSTM) neural network” (Al Mehedi 等, 2023, p. 1) (pdf)
“基于多元长短期记忆(LSTM)神经网络的绿色雨水基础设施性能预 测” (Al Mehedi 等, 2023, pp. -) (pdf)
1区的论文,地球科学1区top
“Journal of Hydrology” (pdf)
这个期刊上的论文可以多看看
总结:
总体来说,这篇论文通过结合LSTM模型、PFI方法和数据驱动的方法,提出了一种新的绿色雨水基础设施性能预测方法,能够更有效地处理和利用大量的环境数据,进而提高城市雨水管理的效率和可持续性。
### 这篇论文的主要创新点包括:
-
使用长短期记忆网络(LSTM)模型预测绿色雨水基础设施(GSI)的性能:LSTM模型能够捕捉时间序列数据中的长期依赖关系,这对于时间序列预测问题特别有用,特别是在过去的值对未来值有重大影响的情况下【13†source】。
-
考虑观测数据的准确性:虽然LSTM模型依赖于观测数据,但如果输入数据不准确或模型未在类似的时间分布的变量上进行训练,可能会产生不准确的预测。未来的研究方向包括结合变量的空间可变性并探索数据集大小对模型性能的影响【14†source】。
-
排列特征重要性(PFI)的应用:PFI能够快速识别特征与模型输出之间的非线性关系,这对于使用LSTM模型建模复杂系统中特征间的复杂关系非常有用。PFI还可以识别对模型性能可能重要的特征之间的相互作用【15†source】【16†source】。
-
克服以往研究的局限性:之前的研究受限于用户定义的测量参数,并使用预期模型(例如格林-安普特模型)进行分析,这使得发现参数间的非传统关系变得困难。本研究采用了数据驱动的方法来解决这一问题【17†source】。就是用的插值平均值。
-
物理导向的LSTM模型:将物理导向的LSTM模型用于增强预测,通过结合物理基础模型(例如SWMM)的知识,并限制模型优化,以更好地融入GSI的物理特性【18†source】。
-
数据预处理和特征工程:为了处理和确保监测数据的质量控制,本研究进行了数据预处理和特征工程。数据集被处理以检测并替换具有特定气候条件的极端和异常值【19†source】。
总体来说,这篇论文通过结合LSTM模型、PFI方法和数据驱动的方法,提出了一种新的绿色雨水基础设施性能预测方法,能够更有效地处理和利用大量的环境数据,进而提高城市雨水管理的效率和可持续性。
评判指标:RMSE,R2,KGE。
有这三个指标的语料库。
GSI
"GSI"通常指的是“绿色雨水基础设施”(Green Stormwater Infrastructure)。这是一种用于管理和处理雨水径流的方法和技术,旨在模仿自然过程以吸收和净化雨水。
数据集:
数据预处理和特征工程:
这一部分的重点是处理和确保监测数据的质量控制。研究中的数据集被处理以检测并替换极端和异常值,用特定于各个气候条件时期的平均值或中位数替换。
与基于物理的模型不同,LSTM模型不需要持续手动校准就能捕捉到这些外部影响因素
输入的lstm的流程图
特征的重要性排序
我也要写一个这样的图表,用到哪些变量,叫啥名字
总结:
可以用到的:
- lstm上的
“在 LSTM 隐藏层中选择 ReLU 作为 激活函数。LSTM 模型的最后一层采用线性激活函数” (Al Mehedi 等, 2023, p. 6) (pdf) - 关于RMSE,R2,KGE3个指标的语料库。
- 太乱了,感觉里面啥都有,数据预处理用了均值进行插值那些异常和无效的值,用了一个特征排序,知道了哪个特征最重要的排名,排列特征重要性(PFI)。那知道了重要性排序,不是可以用注意力机制进行搞??
- 试试这个“通过网 格搜 索技 术获 得了 最优 的超 参数 集” ([Al Mehedi 等, 2023, p. 6],看看咋搞的。(zotero://select/library/items/UF4R7Q25)) (pdf)。
“网 格搜索是 一种实现 简单的技 术,它可 以很容易 地并行化, 以利用多核处理器或分布式计算(Cho et al. , 2022;Z. Fang 等人, 2021;Han et al., 2021)” (Al Mehedi 等, 2023, p. 6) (pdf)