目录
杂谈
-
基于transformer,目前有什么方向:爆破块度分析、井下人员or安全帽等穿戴or异物 姿态检测/算法 【图像&视频识别】、“设备”知识图谱 的构建、时间序列(比如压力)预测、······
-
trm到底好在哪里?【所谓自注意力机制】
想象模型处理信息序列的过程是你去认识一长排陌生人,传统RNN方法 你需要单个逐次去招呼、结识和记忆,当这队人很长时 后期的你会忘记最初几人的信息 即 “梯度消失”,同时这个过程过于缓慢,因为不是 “并行处理”。
现在,trm赋予你一副眼镜or anything that allows you to gain the ability to "filter other people's characteristics”,使你仅去获取各人自身的特征 和 各人与其他人的关系,你这时可以一次性查看所有人(input)、优先与你最想了解的对象 “交谈”(fetch),且忽略对话时的 “噪音”。
-
写作技巧:介绍国内外的时候 分段简单展开一下前人手段+成果【传统?】【AI?】;列举完实验数据之后对比模型→强调你的误差更小;
-
搭建论文之外的平台?例如矿压分析预警 Python设计——可视化 来压、云图等等
-
在论述某个模型在某领域的已证实的应用价值时,可以举不限于能源行业的例子(金融?医疗?···)以丰富参考文献。
一、立论依据
a1、课题来源、选题依据和立论背景
围绕 安全 和 高效 展开:
浅部煤层的开采减少、大部分转向深部开采——开采难度和强度的增大——矿压预测
榆林地区、鄂尔多斯等地区煤炭资源丰富,煤层赋存稳定较易开采,形成了以
神华集团为代表的现代化开采企业,以大规模高强度开采为特点,煤炭产量持续快速增长。然而,榆林地区、鄂尔多斯等地区煤层埋深较浅,加之部分工作面采掘推进速度较快,矿区形成了巨大的开采空间。较浅的煤层埋深、巨大的开采空间、快速推进形成的采动应力场等使得工作面矿压显现特征明显,频繁发生顶板切落、支架冲击载荷等灾害。
a2、研究目的、理论意义和应用价值
二、文献综述
b1国内外现状、发展动态
b2文献查阅范围/手段;参考资料
三、研究内容、技术路线、创新点
c1研究内容及解决的关键技术
c2研究方法/技术路线/实施方案及可行性分析
c3论文的创新点
四、研究基础
d1实验手段、研究和实验条件
d2经费,来源、开支预算
(工程设备、材料须填写名称、规格、数量)
五、工作计划
序号 | 阶段及内容 | 工作量估计(h) | 起讫日期 | 阶段成果/形式 |
---|---|---|---|---|
合计 |
附:评分表、评审小组和意见(略)
开题报告
论文架构
摘要
目录
附表清单\插图清单
1绪论
1.1研究背景、意义
1.2国内外研究现状
1.3论文研究内容、论文组织结构
2.XX(数据/预/处理)方法
介绍[预处理的必要性]:由于传感器的灵敏度会受到空间环境温度、湿度等因素的影响...这些异常数据会阻碍模型提取时间序列数据的特征, 影响机器学习模型的“学习”能力...
"实验数据来自XX省某煤矿的工作面XX年X月X日至..的监测数据.."
a0xx数据的分布特征
介绍数据产生的地理环境、条件,简要交代数据形成的原理,可附【工作面测站布置图】【数据能否分类?分别作图?】···
a1异常值的修正:
3σ原则
...井下传感器可能会工作异常,导致传感器记录数据出现重大误差。同时,为了保证传感器的正常工作,煤矿工作人员会定期对传感器进行调校...
给数据示例!处理过程
a2缺失值的处理:
1直接delete//2基于统计学的填充(前两者都忽略时间性)//3基于机器学习的K最近邻\RNN\最大期望\矩阵分解 等
...传感器采集出错的现象,导致数据缺失。时间序列数据的缺失会使得缺失值前后的数据时间关联性变弱,数据误差变大,影响模型的训练效果...
给数据示例!处理过程
b特征工程
为什么要搞特征工程?数据挖掘中的数据和特征中包含的信息决定了机器学习获取知识和技能的上限,而各种模型和算法的应用是为了能够更大限度地提高学习性能,从而使得学习能力逼近上限。因此对原始数据中的特征处理是非常必要的。通过获取更多的、更好的特征,可以减少模型寻找最优参数的工作量和时间。
检测数据特征衍生:
例子:计算每小时的平均瓦斯浓度、最大值和最小值等来衍生新特征。此外引入滞后特征,例如,将前1小时、前2小时和前3小时的瓦斯浓度作为新的特征,以帮助模型捕捉浓度变化的趋势和模式
时间序列的有监督化:
例子:假设我们有一段时间的瓦斯浓度监测数据,目标是预测未来1小时的瓦斯浓度。选择过去6小时的数据作为输入特征(t-6, t-5,..., t-1的瓦斯浓度),而当前时刻的瓦斯浓度(t)作为输出标签
特征无量纲化:
例子:在训练模型时,瓦斯浓度原始数据范围很大(例如0到1000 ppm),而其他特征(如温度或湿度)的范围则很小(例如0到100),导致模型训练时难以收敛。所以对瓦斯浓度和其他特征进行Z-score标准化或Min-Max归一化,使所有特征在同一范围内,提高训练效果稳定性
以“瓦斯时间序列数据的特征分析”为例:
工程一:衍生
工程二:有监督化
- F (Forecasting Period) - 预测期:想要进行预测的未来时间点。
- LS (Lag Step) - 滞后期步长:从当前时刻往回看多少时间步长来作为输入特征的基础。
- GS (Gap Step) - 空档期步长:向前或向后设置的一个时间间隔,用于定义开始预测的起点。
- TS (Time Step) - 时间步长:预测未来多少个时间步长的数据。
在公式 Supervise(F, LS, GS, TS)
中:输入为一系列的历史特征 f(t-LS)
, f(t-(GS+2))
至 f(t-(GS+1))
,和未来的目标数据 f(t)
, f(t+1)
至 f(t+(TS-1))
。
这里,t
是当前时间点。
历史数据从 t-LS
开始,意味着从当前时间往回看 LS 个时间单位。
空档期从 t-(GS+2)
到 t-(GS+1)
,这是在当前时间点前后(下例中是后)的一个时间间隔,用于处理时间序列中的信息间隔问题,确保不会用到未来数据预测未来。
预测目标是从当前时间 t
到 t+(TS-1)
的数据,即从现在开始的未来 TS 个时间步的数据。
c数据集划分:
时间序列数据是按时间顺序排列的,因此在划分数据集时,不能随机分割(比如将数据随意打乱
2.? 本章小结
3.基于___模型的xx预测/xx分析/xx模拟?
3.1介绍模/网原理
3.2参数确定
3.3预测/分析/模拟 自己模型
3.3.1描述
3.3.2算法实现
3.3.3实验验证
3.4本章小结
4.总结与展望
4.1总结
4.2展望
参考文献
附录
致谢
标签:大纲,特征,模型,时间,3.3,数据,瓦斯 From: https://www.cnblogs.com/yansz001216/p/18526964