首页 > 其他分享 >百度热力图数据获取,原理,处理及论文应用4

百度热力图数据获取,原理,处理及论文应用4

时间:2025-01-15 10:00:03浏览次数:3  
标签:论文 投影 力图 csv 数据 坐标系 百度

目录


0、数据简介

数据来源:百度慧眼
数据形式:含坐标的csv点数据;shp数据(含csv点数据);TIF栅格数据(含csv,shp数据);PNG可视化图片。多种数据形式可选。
价格:市为单位,每天有24个时间点。也可提供shp格式,核密度/反距离tif格式,数据格式不同价格不同。
直接选TIF的好处:不用手动从csv转shp,不用考虑投影带,不用手动核密度,我可以确保数据一定符合你的研究,会跟你确定栅格大小和研究区,根据研究区裁剪数据。
用途:城市/街道活力,人口统计,选址分析,商圈分析,活力分析等等。

优势:全网最全最细!
1、有论文支撑!!!《地理科学》。
2、定量数据!
3、从数据原理到应用给你讲清楚。
4、专注于城市研究。

邮箱437969428@qq.com
你直接在邮箱留下你的联系方式,我加你,节省你的时间,直接说要什么代码就行,不用太正式,你才是上帝,我是希望你买我代码的,所以不用太在意邮件格式。


0、示例数据

CSDN资源

百度热力图定量数据csv,shp,tif 湖州市20241214日12点
百度热力图定量数据csv,shp,tif 深圳市20221114日12点
百度热力图定量数据csv,shp,tif 深圳市20221116日12点
百度热力图定量数据csv,shp,tif 北京市20201018日16点
百度热力图定量数据csv,shp,tif 北京市20201018日12点
百度热力图定量数据csv,shp,tif 成都市20240805日22点
百度热力图定量数据csv,shp,tif 重庆市20240805日20点
百度热力图定量数据csv,shp,tif 长沙市20240916日12点
百度热力图定量数据csv,shp,tif 沈阳市20240713日12点
百度热力图定量数据csv,shp,tif 济南市20240910日12点

数据介绍:百度慧眼百度热力图数据处理,可直接用于论文

1、百度热力图数据日期如何选择

根据研究内容定,一般如果研究城市活力的话,通常会写“非重大节假日,非重大活动,非极端天气等”。南方晴天不多,有小雨或者中雨都可认为没有影响,要不然在南方很难找到完全一周没有下雨的天气。

1.1、其他实验数据的时间

尽量保持在同一年,不能做到1年的话,也没问题,有的论文中会解释为什么不在一年也没事,具体理由记不清了,maybe like 对研究影响很小这种理由。

1.2、看日历

浏览器搜日历
在这里插入图片描述

1.3、看天气

深圳历史天气查询_历史天气预报查询_2345天气预报
在这里插入图片描述

历史天气检索

在这里插入图片描述

深圳的某一周,非重大节假日,非重大活动,天气 晴朗

2、百度热力图几天够研究?部分文章统计

有的甚至都不是定量数据,更不要提精准度了我的数据是定量数据,用于论文完全没有问题。看好的文章,非必要不看老文章/期刊一般的文章,百度热力图的研究很多,好期刊的文章够大家参考了。

参考文献研究区域天数表征活力
2023 王梓蒙等.基于多源数据的城市活力与建成环境非线性关系研究——以双休日武汉市主城区为例[J]. 地理科学进展, 2023, 42(4): 716-729.武汉-TAZ小区2019.11的2个双休日,天数:2,时间点:96个城市活力
2023 汪成刚等.城市活力与建成环境的非线性关系和阈值效应研究——以广州市中心城区为例[J].地理科学进展,2023,42(01):79-88.广州广州中心城区(包括荔湾、越秀、天河和海珠区) -300m格网2021.3.22 ~ 2021.3.26,5个工作7:00~23:00,天数:5,时间点:85个城市活力
2021 司睿等.基于街景数据的建成环境与街道活力时空分析——以深圳福田区为例[J].地理科学,2021,41(09):1536-1545.深圳福田2020.8 .22 ~2020.8.23 天数:2 时间点:48个 爬取的为图片,参照官方图例进行了重分类 共截取热力图 48 张街道活力
2022 Lv, Geyu, et al. “Exploring the relationship between the built environment and block vitality based on multi-source big data: An analysis in Shenzhen, China.” Geomatics, Natural Hazards and Risk 13.1 (2022): 1593-1613.深圳2644个街区2020.7.2日-2020.7.8日,天数:7,时间点:168个城市活力
2021 Fan Z, et al. How did built environment affect urban vitality in urban waterfronts? A case study in Nanjing Reach of Yangtze River[J]. ISPRS International Journal of Geo-Information, 2021, 10(9): 611.南京2020.10.14星期三和2020.10.17日星期六,6:00至22:00,天数:2,时间点:34城市活力
2021 肖龙珠等. Nonlinear and synergistic effects of TOD on urban vibrancy: Applying local explanations for gradient boosting decision tree深圳166个地铁车站2018.6.11~2018.6.17 上午7点至晚上11点,天数:7天,时间点:119个城市活力

自己再多看看同方向研究,一般来说都是5天或7天即一周的数据,要不然审稿人可能会质疑你数据的代表性。

3、数据原理

百度慧眼人口位置数据使用说明
这我朋友的博文,我们的数据一样。为了博文的完整性,我会把部分内容引用过来。

百度慧眼人口位置数据(以下简称“慧眼数据”)主要数据来源于对调用百度地图定位SDK终端定位数据的统计值。首先,百度地图按照百度墨卡托坐标系(bdmc09)将全国划分成200*200的渔网(如下图蓝色实线所示),对某时段内(平台内置为1个小时)调用过定位SDK的终端数量进行统计。如下图黄色区域内,假定该时段内共有7个终端定位数据,那么将该区域的热力值(value)赋值给质心点。
在这里插入图片描述

3.1.1 ** 这个比较重要,后面还会再次出现。核密度的值怎么理解?**

在这里插入图片描述
比如我这个是图核密度按照输出栅格10m,搜索距离300m的出来的数值。
这里某个栅格核密度的值是3478,你能说这个3478表示这个小时的真实人数?
xxx,详细内容见说明文档。
这个值能代表真实的这个小时内街道的人数吗?
xxx,详细内容见说明文档。
你就看你同类型研究是不是用的都是百度热力图数据,如果是,你就也用。如果不是,你能低价买到别的数据吗?能就买别的数据,不能就百度热力图。不要没有别的数据还挑挑拣拣。
你如果做相关性/影响机制的研究,核密度值完全没问题,他确实能反映聚类中心,热力中心。
建议大家在出图的时候,xxx,如下面这些文章。

没空复制

论文中怎么写这个值,建议看下论文,常见的写法
xxx,详细内容见说明文档。

3.1.2 Csv->shp->tif是常规的数据处理流程,可以不这么处理吗?

xxx,详细内容见说明文档。

3.1.3 Bd09mc即百度墨卡托投影坐标系200单位的距离是可以自己设置的吗?

系统内置的是200米,这个没法调整的,官方就是这样设置的200单位

3.1.4 实际采样点是什么样?

实际的采样点是全覆盖,像下图,非常密集。
在这里插入图片描述

全采样点示例
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/bd6c8002e47047eab17607b439dafe00.png#pic_center =500x)
放大后,采样点及采样点间距离
在WGS84坐标系中,两个采样点的实际距离约为185m,半径约92.5m。即92.5m x 92.5m围成的方格内每小时定位的总和汇总到采样点。

3.1.5 有些地方没有采样点是什么原因?

在这里插入图片描述

以某一时刻深圳数据为例,csv转shp后,为什么有空白?
是因为这个采样点value为0,没有存储,要不然会造成文件冗余。

4、csv文件字段说明

在这里插入图片描述
转化关系:bd09mc->bd09->wgs84。怎么转不重要,直接用wgs84就行了。

原始数据样式如下:
bd09mc_X,bd09mc_Y:百度墨卡托坐标系(为投影坐标系)横纵轴坐标,以上面黄色区域质心为例,对应的坐标为“11592300,3564500”;
value:该时段内质心点对应区域内调用定位的终端数统计数,单位:次;
bd09_LNG,bd09_LAT:百度坐标系(为地理坐标系)横纵轴坐标;
wgs84_LNG,wgs84_LAT:WGS 1984坐标系(为地理坐标系,EPSG:4326)横纵轴坐标;
gcj02_LNG,gcj02_LAT: GCJ-02坐标系(也称:火星坐标系,为地理坐标系)横纵轴坐标。

4、Arcgis,QGIS软件数据处理教程(最近太忙后续更新)

4.1、Arcgis篇操作

这我朋友写的博文,百度热力图arcgis数据处理

从我这里买数据,送详细说明文档,文档写完了,但是没空复制到这里,调格式调半天。
xxx,详细内容见说明文档。
在这里插入图片描述

4.2、QGIS篇操作

从我这里买数据,送详细说明文档,文档写完了,但是没空复制到这里,调格式调半天。
xxx,详细内容见说明文档。

5、Arcgis PRO 百度热力图数据处理流程!!!

PS:提供批量处理数据服务!直接给你栅格数据,需要可以邮箱联系。帮你省去下面这么多繁琐的步骤。

(1)csv数据可视化!!!

在这里插入图片描述

1.添加数据

在这里插入图片描述

2.选择csv 或者csv拖拽进来,这里就可以直接选了

在这里插入图片描述

3.经纬度,坐标系,选择保存位置,保存名称
或者直接在搜索栏搜索:“XY表转点”

在这里插入图片描述

4.搜索栏搜索:“XY表转点”

(2)为什么要投影?

投影能更准确地处理空间分析中的距离和面积计算。
• 地理坐标系(经纬度):经纬度表示的是角度,而不是实际距离。因此,在地理坐标系中直接进行距离或面积计算会导致误差。
• 投影坐标系(米/公里):投影坐标系将地球的曲面展开为平面,单位通常为米或公里,可以直接用于空间分析。
核密度分析需要计算点与点之间的距离,并基于距离分布生成密度图。如果不进行投影,分析结果的精度会受到影响,特别是在大范围地区分析时。小范围实际影响不大。出于准确性考虑,投影。

(3)UTM投影的选择(地区->投影带)

UTM投影的选择(地区->投影带)
在这里插入图片描述

投影带选择,直接代公式

(4)投影,转投影坐标系

在这里插入图片描述

1.直接搜投影,输出坐标系点那个“地球”图表,选投影看下图。
!哎呦,新发现,可以直接输入坐标系:WGS_1984_UTM_Zone_50N

在这里插入图片描述

2.投影坐标系-》UTM

在这里插入图片描述

3. UTM-》WGS84-》Northern Hemisphere

在这里插入图片描述

4. 找到自己的投影带

(5)核密度分析

在这里插入图片描述

1.直接搜

在这里插入图片描述

2.步骤

在这里插入图片描述

3.看效果

在这里插入图片描述

4.符号系统

在这里插入图片描述

5.效果

6、核密度分析的数学原理

xxx,详细内容见说明文档。

7、是否需要根据研究区进行裁剪?

xxx,详细内容见说明文档。

8、核密度输出栅格大小,搜索距离怎么选?

xxx,详细内容见说明文档。

9、常见应用

9.1 用途(空间结构研究,城区职住关系,人群聚集时空分析,XX活力测度)

其中,城市规划领域对于百度热力图做了较多的探索。比如有:吴志强基于热力图进行上海中心城区的空间结构研究;冷炳荣利用热力图进行重庆市主城区职住关系的剖析;王录仓基于热力图对武汉市主城区城市人群聚集程度进行的时空分析;周雨霏基于热力图的轨道交通站点服务区活力测度研究等等。

9.2 求周中平均/周末平均/周平均/日平均活力强度

xxx,详细内容见说明文档。

9.3 时间序列

xxx,详细内容见说明文档。

10、活力计算/相关论文

2024 黄志强 基于多源大数据的街道空间品质测度及其对街道 活力的影响*——以广州历史城区为例

热力图等级。xxx,详细内容见说明文档。

2021 司睿 基于街景数据的建成环境与街道活力时空分析 —以深圳福田区为例

涉及面积。和除于栅格区别不大。xxx,详细内容见说明文档。

xxx。

xxx,详细内容见说明文档。
太多了,复制不过来,调格式太繁琐。


11、其他数据处理/程序/指导!!!

直接看PDF吧,搬过来调格式类似了。
通过网盘分享的文件:v1.1 数据_代码_指导.pdf
链接: https://pan.baidu.com/s/1E93QTFcdl7DQjCYZW1Kj2Q?pwd=GGGX 提取码: GGGX

目录:GIS数据处理/程序/指导,街景百度热力图POI路网建筑物AOI等

  1. 百度热力图指导,买数据提供指导,含详细说明文档。链接0-数据介绍:百度慧眼百度热力图数据处理,可直接用于论文链接1-原理及应用:百度热力图数据获取,原理,处理及论文应用-CSDN博客链接2-Pro操作:百度热力图数据处理流程Arcgis PRO篇,Arcgis,QGIS见链接其他文章-CSDN博客

  2. 多模型(含全部树模型)分类回归精度结果对比(回复审稿人意见之:为什么选某个模型?比如为什么选XGBoost?)。

    回归模型:线性模型(Linear、Ridge 、Lasso、Huber 、Partial Least Squares),KNN,SVR,树模型(Decision Tree、RF、AdaBoost 、GBDT、XGBoost、LightGBM 、CatBoost )。可自定义增加。
    分类模型:Logistic Regression、Naive Bayes、KNN、SVM、树模型(Decision Tree、RF、AdaBoost 、GBDT、XGBoost、LightGBM 、CatBoost )可自定义增加。
    

3.各种树模型分类回归代码(RF/GBDT/XGBoost/LightGBM/Catboost等模型对比,最优模型最优参数)。
3. 树模型-SHAP分析,上一步选模型,这一步用模型进行分析。
4. GCN用于街道研究,如GCN实现街道功能分类。
5. 树模型-SHAP分析,上一步选模型,这一步用模型进行分析。
6. 街景语义分割后像素提取,指标计算代码(绿视率、天空开阔度、界面围合度、视觉熵/景观多样性等),含详细说明文档。deeplabv3+街景图片语义分割,无需训练模型,看不懂也没有影响,直接使用,cityscapes数据集
7. 街景主观感知两两对比程序(数据集生成,自定义每张图片出现次数,提示剩余总对比次数,对比程序!最少对比次数,最高的效率。街景主观感知1:街景图片两两对比程序),TrueSkill计算beautiful、safer等维度主观感知评分(原理,代码)均含详细说明文档。街景两两对比程序,Trueskill计算评分代码,训练模型,预测街景
8. 街景主观感知训练,预测模型(beautiful, safer等自定义维度),多模型对比(ResNet50,ResNet101,EfficientNet、VGGNet、GoogleNet、DenseNet、MobileNet、ShuffleNet、Xception、ConvNeXt、Vision Transformer (ViT)、RegNet等),beautiful和safer维度精度均达到0.89。街景两两对比程序,Trueskill计算评分代码,训练模型,预测街景
9. 街景图片色彩聚类。
10. 全国街景数据。
11. OSM路网简化指导(详细说明文档,双线变单线,fclass选择,拓扑检查,短道路处理)。
12. POI数据,重分类,各种密度,各种比例,功能混合度/熵/多样性计算。
13. 建筑物各种指标计算(建筑密度,容积率)。
14. 坐标系转化代码(bg09,wgs84,Gcj02等各种地理,投影转化)。
15. GIS相关处理,指标计算,街道街区相关,活力相关,街道品质相关。
。。

标签:论文,投影,力图,csv,数据,坐标系,百度
From: https://blog.csdn.net/m0_48587622/article/details/145106332

相关文章

  • 2025年毕设ssm未来新型养老院管理系统论文+源码
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景随着全球人口老龄化的加剧,养老院作为老年人生活照顾的重要机构,其管理效率和服务质量日益成为社会关注的焦点。关于养老院管理系统的研究,现有文献主要......
  • 2025年毕设ssm卫生人员评审专家申报系统论文+源码
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景在当前医疗卫生领域,随着信息技术的飞速发展,卫生人员评审与专家申报系统的建设已成为提升医疗管理效率与质量的关键环节。关于卫生人员评审系统的研究......
  • 百度面试真题 - 大小端字节序问题(联合体/共用体 - 面试加分)
    标题大小端字节序标题大小端字节序(联合体/共用体)优质资源以上bilibili教程(大小端存储-详细简介)(空间也有)目录​编辑简介大小端存储(空间视频详解):强制类型转换- char*:巧用联合体,解决百度面试题 - 大小端字节序问题:使用联合体的优点:简介......
  • AI写作只适合娱乐?这些工具却能让论文创作效率快速提升
    7款AI论文写作工具推荐,让写论文变得简单又有趣!对于留学生和科研工作者来说,写英文论文往往让人感到很头疼。语言不太流利、学术要求高、逻辑结构复杂……这些问题真的是让人挠头。不过,别担心!现在有很多超级棒的AI写作工具,可以帮我们减轻负担,无论是生成初稿、改写段落,还是润色语......
  • 必读的100篇生成式AI论文清单
    2024年真是生成式人工智能研究大放异彩的一年!最让我们惊讶的是,整个领域的焦点发生了翻天覆地的变化。尤其是在2023年和2024年,情况开始变得截然不同,由于大模型模型已经能够做很多事情,因此也更加关注应用层面的研究。论文集合地址:https://github.com/aishwaryanr/aweso......
  • flask框架团购轻量级网站毕设源码+论文
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、选题背景关于团购轻量级网站的研究,现有研究主要以大型团购平台或综合电商平台中的团购板块为主,专门针对轻量级团购网站的研究较少。在国内外,大......
  • springboot毕设 基于Springbootvue的教学辅助系统设计与实现 程序+论文
    本系统(程序+源码)带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着信息技术的迅猛发展,教育领域正经历着深刻的变革。传统的教学模式已难以满足当前多元化、个性化的学习需求。在这一背景下,教学辅助系统的出现成为......
  • node.js基于RFID技术的智能仓储系统设计与实现程序+论文 可用于毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容一、选题背景关于智能仓储系统的研究,现有研究多集中在传统仓储管理的自动化改进方面,如引入自动化设备来提高货物搬运效率等。专门针对基于RFID技术的智能仓储系统的......
  • node.js农业管理系统程序+论文 可用于毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容一、选题背景关于农业管理系统的研究,现有研究多侧重于农业生产环节的管理或单一功能模块的构建。例如,在一些发达国家,农业信息化管理主要集中在大型农场的生产流程优......
  • node.js瓶装水售卖系统程序+论文 可用于毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容一、选题背景关于瓶装水售卖系统的研究,现有研究主要以传统零售模式下的销售策略为主,专门针对瓶装水售卖系统的研究较少。在国内外,瓶装水行业发展迅速,但在售卖系统方......