项目介绍
台风灾害期间房屋损坏率预测。该数据集来源于荷兰红十字会提供的510全球数据库,包括过去二十年来菲律宾发生的12次典型台风的数据,数据见文件all.csv。以下是这些台风的名称:“Bopha”,“Goni”, “Hagupit”, “Haima”, “Haiyan”, Kalmaegi”, “Koppu”, “Melor”, “Nock-Ten”, “Rammasun”, “Sarika”和“Utor”。台风灾害数据包括1638次观测值。
下面简介预测目标、台风事件相关变量、现场地形特征和城市社会经济指标相关的变量。其他部分变量也可由于英文单词可推出它的含义。
指标类型 | 指标说明 | 属性名 | 说明 |
---|---|---|---|
预测目标 | 房屋损坏率的变量 | Total.damaged.houses..rel.. | 房屋损坏率 |
危险指标 | 与台风事件相关的变量 | Windspeed [km/h] | 风速 |
Distance.to.typhoon [km]] | 台风路径到城市中心的最短距离 | ||
Rainfall [mm] | 降雨量 | ||
Distance_first_impact [km] | 从台风登陆点到城市中心的距离 | ||
Experience[-] | 本次台风前,该市所属地区承受台风的平均次数 | ||
现场和社会经济指标 | 与现场地形特征和城市社会经济指标相关的变量:。只取决于市政当局,而不取决于台风(假设它们在时间上相对稳定)。 | Elevation [m] | 城市的平均海拔 |
Slope [°] | 城市的平均地形坡度 | ||
Slope_stdev [-] | 城市地形坡度的标准差 | ||
Ruggedness [-] | 城市的平均地形崎岖度 | ||
Ruggedness_stdev [-] | 城市地形崎岖度的标准偏差 | ||
Population.density [hab/km2] | 人口密度 | ||
Poverty.incidence [-] | 贫困发生率 | ||
X..skilled.Agriculture.Forestry.Fishermen [-] | 熟练的农业/林业/渔民的比例 | ||
X..strong.roof.type [-] | 强屋顶类型比例 | ||
X..strong.wall.type [-] | 强墙类型比例 |
流程
- 数据探索分析师
- 数据清洗,如异常值、缺失值、数据标准化等
- 特征选择
- 模型训练