如何用Excel爬取网页数据?是的,你没有听错,习惯性的数据爬取大家都想到的是Python,很多教程也是在讲Python数据爬取,今天给大家讲得是如何用Excel爬取网页数据,不仅可以爬取网页数据,还可以实时刷新,生成动态的三维可视化图形。
本文使用Microsoft Office 专业增强版 2019工具,爬取全国城市住宅房价排行榜数据,然后借助Excel内置的三维地理可视化加载项 Power Map,制作三维可视化图形,下面一起来学习。
数据爬取
第一步、新建一个Exce空白工作表,点击菜单栏中的数据选项卡,选择获取外部数据自Web。
第二步、在弹出的新建Web查询对话框复制粘贴全国城市住宅房价排行榜网站的url地址,点击转到进入网站内部,框选箭头部分的数据,点击导入。
第三步、弹出导入数据对话框,数据存放位置选择现有工作表A1单元格内,点击确定。
第四步、数据概览,数据导入结果如下所示,分为序号、城市名称、平均单价、环比、同比五个字段。
第五步、数据自动更新设置,为了让Excel表格中的数据可以跟目标网站的数据一样自动更新,可以在菜单栏的数据选项卡,点击全部刷新设置连接属性。
勾选刷新频率,设置每60分钟刷新一次,即可实现Excel表格中的数据跟目标网站的数据一样自动更新。
数据可视化
第一步、爬取数据后,我们要看各个城市在不同的地理空间的平均房价情况,这里剔出深圳市(没有数据),选择城市名称和平均单价两列,插入三维地图。
第二步、选择簇状柱形图,在城市名称里选择城市,可以到看每个城市的平均房价,高度这里选择平均房价,另外还可以对柱形做图层选项设置,比如柱形的高度和厚度。
除了对各个城市的平均房价做三维地图可视化,还可以输出视频,完整的视频输出结果可点击下方视频。