首页 > 其他分享 >2023网络爬虫 -- 获取动态加载数据

2023网络爬虫 -- 获取动态加载数据

时间:2023-02-04 11:34:51浏览次数:43  
标签:www -- 爬虫 kfccda ashx kfc 2023 post com


1、爬取的网址

http://www.kfc.com.cn/kfccda/storelist/index.aspx

2、要爬取的内容,输入关键字,点击查询,获取餐厅名称和餐厅地址



2023网络爬虫 -- 获取动态加载数据_动态加载


3、F12,打开开发者工具,点击查询,抓包



2023网络爬虫 -- 获取动态加载数据_Python_02


4、点击标头,查看请求网址,是post请求,查看载荷也就是提交的参数

http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword



2023网络爬虫 -- 获取动态加载数据_Python_03


5、表单数据就是我们要提交的数据



2023网络爬虫 -- 获取动态加载数据_Powered by 金山文档_04


6、导入requests包

import requests

7、头和提交的参数

头={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}参数={"cname":"","pid":"","keyword": "河南","pageIndex": "1","pageSize": "10",}

8、要获取的网址

网页="http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword"

9、post请求,提交参数需要data

响应=requests.post(网页,headers=头,data =参数)

10、获取JSON数据

响应内容=响应.json()

11、将数据存储

withopen("kfc.txt","w",encoding="utf-8") as 数据:for i in 响应内容['Table1']:        店名=i['storeName']        地址=i["addressDetail"]        数据.write(店名+"餐厅"+":"+地址+"\n")

12、存储结果



2023网络爬虫 -- 获取动态加载数据_Python_05


标签:www,--,爬虫,kfccda,ashx,kfc,2023,post,com
From: https://blog.51cto.com/u_15288375/6037003

相关文章

  • Maven6 - 依赖传递
    测试依赖的传递性依赖的传递性概念A依赖B,B依赖C,那么在A没有配置对C的依赖的情况下,A里面能不能直接使用C?传递的原则在A依赖B,B依赖C的前提下,C是否能够......
  • 二叉树
    二叉树二叉树的概念二叉树是n(n≥0)个结点的有限集或者是空集(n=O),或者由一个根结点及两棵互不相交的分别称作这个根的左子树和右子树的二叉树组成二叉树结构最简单......
  • 后端问题排错
    查看错误日志1、首先在启动时候查看控制台是否错误信息,然后在去控制台查看是显示的错误信息是什么,一定要从最后向上查看错误信息并且找到“Causedby”字眼去查看错误信息。......
  • vue3 与vue2的区别-cnblog
    vue3与vue2的区别1.template节点vue2只允许一个根节点vue3允许多个根节点2.创建工具vue3:使用vite,也可使用vue-clivue2:使用vue-clivite创建3.调试工......
  • Qt 中多线程的使用
    前言在进行桌面应用程序开发的时候,假设应用程序在某些情况下需要处理比较复杂的逻辑,如果只有一个线程去处理,就会导致窗口卡顿,无法处理用户的相关操作。这种情况下就需要使......
  • 【PHP 随记】—— Composer 安装项目以及项目的扩展
    文章目录​​1、Composer安装项目​​​​①项目安装示例​​​​②相关问题解决​​​​③框架搜索指南​​​​2、Composer安装项目的扩展​​使用Composer更轻松......
  • URL编码
    介绍URL编码URL编码也被称为百分号编码。URL编码的规则:简单来说,如果需要对一个字符进行URL编码,首先需要判断该字符是否是ASCII字符:如果一个字符是ASCII字符......
  • 【PHP 随记】—— laravel 项目环境搭建
    文章目录​​1、安装laravel以及phpstorm开发插件​​​​2、配置虚拟主机与绑定hosts文件​​​​①配置虚拟主机​​​​②hosts绑定​​​​③验证​​​​3、......
  • react生命周期
    总结-旧生命周期初始化阶段:由ReactDOM.render()触发---初次渲染constructor()componentWillMount()render()componentDidMount()===>常用一般在这个钩子中做一......
  • Python大数据处理利器,PySpark的入门实战
    PySpark极速入门一:Pyspark简介与安装什么是Pyspark?PySpark是Spark的Python语言接口,通过它,可以使用PythonAPI编写Spark应用程序,目前支持绝大多数Spark功能。目前Spark官方在......