目录
- 0、数据简介
- 0、示例数据
- 1、百度热力图数据日期如何选择
- 2、百度热力图几天够研究?部分文章统计
- 3、数据原理
- 4、csv文件字段说明
- 4、Arcgis,QGIS软件数据处理教程(最近太忙后续更新)
- 5、Arcgis PRO 百度热力图数据处理流程!!!
- 6、核密度分析的数学原理
- 7、是否需要根据研究区进行裁剪?
- 8、核密度输出栅格大小,搜索距离怎么选?
- 9、常见应用
- 10、活力计算/相关论文
- 11、其他数据处理/程序/指导!!!
0、数据简介
数据来源:百度慧眼
数据形式:含坐标的csv点数据;shp数据(含csv点数据);TIF栅格数据(含csv,shp数据);PNG可视化图片。多种数据形式可选。
价格:市为单位,每天有24个时间点。也可提供shp格式,核密度/反距离tif格式,数据格式不同价格不同。
直接选TIF的好处:不用手动从csv转shp,不用考虑投影带,不用手动核密度,我可以确保数据一定符合你的研究,会跟你确定栅格大小和研究区,根据研究区裁剪数据。
用途:城市/街道活力,人口统计,选址分析,商圈分析,活力分析等等。
优势:全网最全最细!
1、有论文支撑!!!《地理科学》。
2、定量数据!
3、从数据原理到应用给你讲清楚。
4、专注于城市研究。
邮箱:437969428@qq.com
你直接在邮箱留下你的联系方式,我加你,节省你的时间,直接说要什么代码就行,不用太正式,你才是上帝,我是希望你买我代码的,所以不用太在意邮件格式。
0、示例数据
CSDN资源
百度热力图定量数据csv,shp,tif 湖州市20241214日12点
百度热力图定量数据csv,shp,tif 深圳市20221114日12点
百度热力图定量数据csv,shp,tif 深圳市20221116日12点
百度热力图定量数据csv,shp,tif 北京市20201018日16点
百度热力图定量数据csv,shp,tif 北京市20201018日12点
百度热力图定量数据csv,shp,tif 成都市20240805日22点
百度热力图定量数据csv,shp,tif 重庆市20240805日20点
百度热力图定量数据csv,shp,tif 长沙市20240916日12点
百度热力图定量数据csv,shp,tif 沈阳市20240713日12点
百度热力图定量数据csv,shp,tif 济南市20240910日12点
1、百度热力图数据日期如何选择
根据研究内容定,一般如果研究城市活力的话,通常会写“非重大节假日,非重大活动,非极端天气等”。南方晴天不多,有小雨或者中雨都可认为没有影响,要不然在南方很难找到完全一周没有下雨的天气。
1.1、其他实验数据的时间
尽量保持在同一年,不能做到1年的话,也没问题,有的论文中会解释为什么不在一年也没事,具体理由记不清了,maybe like 对研究影响很小这种理由。
1.2、看日历
浏览器搜日历
1.3、看天气
2、百度热力图几天够研究?部分文章统计
有的甚至都不是定量数据,更不要提精准度了,我的数据是定量数据,用于论文完全没有问题。看好的文章,非必要不看老文章/期刊一般的文章,百度热力图的研究很多,好期刊的文章够大家参考了。
参考文献 | 研究区域 | 天数 | 表征活力 |
---|---|---|---|
2023 王梓蒙等.基于多源数据的城市活力与建成环境非线性关系研究——以双休日武汉市主城区为例[J]. 地理科学进展, 2023, 42(4): 716-729. | 武汉-TAZ小区 | 2019.11的2个双休日,天数:2,时间点:96个 | 城市活力 |
2023 汪成刚等.城市活力与建成环境的非线性关系和阈值效应研究——以广州市中心城区为例[J].地理科学进展,2023,42(01):79-88. | 广州广州中心城区(包括荔湾、越秀、天河和海珠区) -300m格网 | 2021.3.22 ~ 2021.3.26,5个工作7:00~23:00,天数:5,时间点:85个 | 城市活力 |
2021 司睿等.基于街景数据的建成环境与街道活力时空分析——以深圳福田区为例[J].地理科学,2021,41(09):1536-1545. | 深圳福田 | 2020.8 .22 ~2020.8.23 天数:2 时间点:48个 爬取的为图片,参照官方图例进行了重分类 共截取热力图 48 张 | 街道活力 |
2022 Lv, Geyu, et al. “Exploring the relationship between the built environment and block vitality based on multi-source big data: An analysis in Shenzhen, China.” Geomatics, Natural Hazards and Risk 13.1 (2022): 1593-1613. | 深圳2644个街区 | 2020.7.2日-2020.7.8日,天数:7,时间点:168个 | 城市活力 |
2021 Fan Z, et al. How did built environment affect urban vitality in urban waterfronts? A case study in Nanjing Reach of Yangtze River[J]. ISPRS International Journal of Geo-Information, 2021, 10(9): 611. | 南京 | 2020.10.14星期三和2020.10.17日星期六,6:00至22:00,天数:2,时间点:34 | 城市活力 |
2021 肖龙珠等. Nonlinear and synergistic effects of TOD on urban vibrancy: Applying local explanations for gradient boosting decision tree | 深圳166个地铁车站 | 2018.6.11~2018.6.17 上午7点至晚上11点,天数:7天,时间点:119个 | 城市活力 |
自己再多看看同方向研究,一般来说都是5天或7天即一周的数据,要不然审稿人可能会质疑你数据的代表性。
3、数据原理
百度慧眼人口位置数据使用说明
这我朋友的博文,我们的数据一样。为了博文的完整性,我会把部分内容引用过来。
百度慧眼人口位置数据(以下简称“慧眼数据”)主要数据来源于对调用百度地图定位SDK终端定位数据的统计值。首先,百度地图按照百度墨卡托坐标系(bdmc09)将全国划分成200*200的渔网(如下图蓝色实线所示),对某时段内(平台内置为1个小时)调用过定位SDK的终端数量进行统计。如下图黄色区域内,假定该时段内共有7个终端定位数据,那么将该区域的热力值(value)赋值给质心点。
3.1.1 ** 这个比较重要,后面还会再次出现。核密度的值怎么理解?**
比如我这个是图核密度按照输出栅格10m,搜索距离300m的出来的数值。
这里某个栅格核密度的值是3478,你能说这个3478表示这个小时的真实人数?
xxx,详细内容见说明文档。
这个值能代表真实的这个小时内街道的人数吗?
xxx,详细内容见说明文档。
你就看你同类型研究是不是用的都是百度热力图数据,如果是,你就也用。如果不是,你能低价买到别的数据吗?能就买别的数据,不能就百度热力图。不要没有别的数据还挑挑拣拣。
你如果做相关性/影响机制的研究,核密度值完全没问题,他确实能反映聚类中心,热力中心。
建议大家在出图的时候,xxx,如下面这些文章。
论文中怎么写这个值,建议看下论文,常见的写法
xxx,详细内容见说明文档。
3.1.2 Csv->shp->tif是常规的数据处理流程,可以不这么处理吗?
xxx,详细内容见说明文档。
3.1.3 Bd09mc即百度墨卡托投影坐标系200单位的距离是可以自己设置的吗?
系统内置的是200米,这个没法调整的,官方就是这样设置的200单位
3.1.4 实际采样点是什么样?
实际的采样点是全覆盖,像下图,非常密集。
3.1.5 有些地方没有采样点是什么原因?
以某一时刻深圳数据为例,csv转shp后,为什么有空白?
是因为这个采样点value为0,没有存储,要不然会造成文件冗余。
4、csv文件字段说明
转化关系:bd09mc->bd09->wgs84。怎么转不重要,直接用wgs84就行了。
原始数据样式如下:
bd09mc_X,bd09mc_Y:百度墨卡托坐标系(为投影坐标系)横纵轴坐标,以上面黄色区域质心为例,对应的坐标为“11592300,3564500”;
value:该时段内质心点对应区域内调用定位的终端数统计数,单位:次;
bd09_LNG,bd09_LAT:百度坐标系(为地理坐标系)横纵轴坐标;
wgs84_LNG,wgs84_LAT:WGS 1984坐标系(为地理坐标系,EPSG:4326)横纵轴坐标;
gcj02_LNG,gcj02_LAT: GCJ-02坐标系(也称:火星坐标系,为地理坐标系)横纵轴坐标。
4、Arcgis,QGIS软件数据处理教程(最近太忙后续更新)
4.1、Arcgis篇操作
这我朋友写的博文,百度热力图arcgis数据处理
从我这里买数据,送详细说明文档,文档写完了,但是没空复制到这里,调格式调半天。
xxx,详细内容见说明文档。
4.2、QGIS篇操作
从我这里买数据,送详细说明文档,文档写完了,但是没空复制到这里,调格式调半天。
xxx,详细内容见说明文档。
5、Arcgis PRO 百度热力图数据处理流程!!!
PS:提供批量处理数据服务!直接给你栅格数据,需要可以邮箱联系。帮你省去下面这么多繁琐的步骤。
(1)csv数据可视化!!!
(2)为什么要投影?
投影能更准确地处理空间分析中的距离和面积计算。
• 地理坐标系(经纬度):经纬度表示的是角度,而不是实际距离。因此,在地理坐标系中直接进行距离或面积计算会导致误差。
• 投影坐标系(米/公里):投影坐标系将地球的曲面展开为平面,单位通常为米或公里,可以直接用于空间分析。
核密度分析需要计算点与点之间的距离,并基于距离分布生成密度图。如果不进行投影,分析结果的精度会受到影响,特别是在大范围地区分析时。小范围实际影响不大。出于准确性考虑,投影。
(3)UTM投影的选择(地区->投影带)
(4)投影,转投影坐标系
(5)核密度分析
6、核密度分析的数学原理
xxx,详细内容见说明文档。
7、是否需要根据研究区进行裁剪?
xxx,详细内容见说明文档。
8、核密度输出栅格大小,搜索距离怎么选?
xxx,详细内容见说明文档。
9、常见应用
9.1 用途(空间结构研究,城区职住关系,人群聚集时空分析,XX活力测度)
其中,城市规划领域对于百度热力图做了较多的探索。比如有:吴志强基于热力图进行上海中心城区的空间结构研究;冷炳荣利用热力图进行重庆市主城区职住关系的剖析;王录仓基于热力图对武汉市主城区城市人群聚集程度进行的时空分析;周雨霏基于热力图的轨道交通站点服务区活力测度研究等等。
9.2 求周中平均/周末平均/周平均/日平均活力强度
xxx,详细内容见说明文档。
9.3 时间序列
xxx,详细内容见说明文档。
10、活力计算/相关论文
2024 黄志强 基于多源大数据的街道空间品质测度及其对街道 活力的影响*——以广州历史城区为例
热力图等级。xxx,详细内容见说明文档。
2021 司睿 基于街景数据的建成环境与街道活力时空分析 —以深圳福田区为例
涉及面积。和除于栅格区别不大。xxx,详细内容见说明文档。
xxx。
xxx,详细内容见说明文档。
太多了,复制不过来,调格式太繁琐。
11、其他数据处理/程序/指导!!!
直接看PDF吧,搬过来调格式类似了。
通过网盘分享的文件:v1.1 数据_代码_指导.pdf
链接: https://pan.baidu.com/s/1E93QTFcdl7DQjCYZW1Kj2Q?pwd=GGGX 提取码: GGGX
目录:GIS数据处理/程序/指导,街景百度热力图POI路网建筑物AOI等
-
百度热力图指导,买数据提供指导,含详细说明文档。链接0-数据介绍:百度慧眼百度热力图数据处理,可直接用于论文。链接1-原理及应用:百度热力图数据获取,原理,处理及论文应用-CSDN博客 。链接2-Pro操作:百度热力图数据处理流程Arcgis PRO篇,Arcgis,QGIS见链接其他文章-CSDN博客。
-
多模型(含全部树模型)分类回归精度结果对比(回复审稿人意见之:为什么选某个模型?比如为什么选XGBoost?)。
回归模型:线性模型(Linear、Ridge 、Lasso、Huber 、Partial Least Squares),KNN,SVR,树模型(Decision Tree、RF、AdaBoost 、GBDT、XGBoost、LightGBM 、CatBoost )。可自定义增加。 分类模型:Logistic Regression、Naive Bayes、KNN、SVM、树模型(Decision Tree、RF、AdaBoost 、GBDT、XGBoost、LightGBM 、CatBoost )可自定义增加。
3.各种树模型分类回归代码(RF/GBDT/XGBoost/LightGBM/Catboost等模型对比,最优模型最优参数)。
3. 树模型-SHAP分析,上一步选模型,这一步用模型进行分析。
4. GCN用于街道研究,如GCN实现街道功能分类。
5. 树模型-SHAP分析,上一步选模型,这一步用模型进行分析。
6. 街景语义分割后像素提取,指标计算代码(绿视率、天空开阔度、界面围合度、视觉熵/景观多样性等),含详细说明文档。deeplabv3+街景图片语义分割,无需训练模型,看不懂也没有影响,直接使用,cityscapes数据集。
7. 街景主观感知两两对比程序(数据集生成,自定义每张图片出现次数,提示剩余总对比次数,对比程序!最少对比次数,最高的效率。街景主观感知1:街景图片两两对比程序),TrueSkill计算beautiful、safer等维度主观感知评分(原理,代码)均含详细说明文档。街景两两对比程序,Trueskill计算评分代码,训练模型,预测街景。
8. 街景主观感知训练,预测模型(beautiful, safer等自定义维度),多模型对比(ResNet50,ResNet101,EfficientNet、VGGNet、GoogleNet、DenseNet、MobileNet、ShuffleNet、Xception、ConvNeXt、Vision Transformer (ViT)、RegNet等),beautiful和safer维度精度均达到0.89。街景两两对比程序,Trueskill计算评分代码,训练模型,预测街景。
9. 街景图片色彩聚类。
10. 全国街景数据。
11. OSM路网简化指导(详细说明文档,双线变单线,fclass选择,拓扑检查,短道路处理)。
12. POI数据,重分类,各种密度,各种比例,功能混合度/熵/多样性计算。
13. 建筑物各种指标计算(建筑密度,容积率)。
14. 坐标系转化代码(bg09,wgs84,Gcj02等各种地理,投影转化)。
15. GIS相关处理,指标计算,街道街区相关,活力相关,街道品质相关。
。。