首页 > 其他分享 >猪八戒网服务商名称爬取

猪八戒网服务商名称爬取

时间:2023-03-02 23:46:23浏览次数:34  
标签:url text resp 猪八戒 爬取 服务商 print div divs

import requests
from lxml import etree

url = 'https://changsha.zbj.com/xcxkfzbjzbj/f.html?fr=zbj.sy.zyyw_2nd.lv3&r=2'

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.49'
}

resp = requests.get(url=url,headers=headers)
# print(resp.text)

# 解析
tree = etree.HTML(resp.text)

# 定位到一个大框架,里面放着每一个商品的标题,价格什么的
divs = tree.xpath('//*[@class="search-result-list"]/div[1]/*')
# print(divs)
for div in divs:
    title = div.xpath('.//*[@class="name-pic-box"]/a/text()')
    print(title)

标签:url,text,resp,猪八戒,爬取,服务商,print,div,divs
From: https://www.cnblogs.com/Wesuiliye/p/17174044.html

相关文章

  • 爬虫实战---爬取图片
    爬虫实战---爬取图片importrequestsimportreforpageinrange(1,11):ifpage==1:url="http://www.netbian.com/meinv/index.htm"else:......
  • HTTP代理如何爬取?保姆式教程(附测试视频)
    在网络爬虫的应用中,HTTP代理的使用是常见的技术手段之一。通过使用HTTP代理,爬虫可以模拟不同的访问来源,避免被目标网站识别出爬虫行为,从而提高爬虫的成功率和效率。那么,如何......
  • python初学者也能搞定微信公众号爬取
    微信公众号爬取,网上的东西很多。这里主要分两个阶段1.把公众号的文章URL爬取并保存下来。2.根据这些URL把内容下载下来。把URL爬取下来这里采用了,微信公众平台的方法,也就......
  • 一个多线程爬取http://www.infobank.cn的爬虫
    importrequestsfrombs4importBeautifulSoupimportreimportopenpyxlfrommultiprocessing.dummyimportPoolimporttimeimportos#从输入表格获取数据defread_exce......
  • 爬取电影天堂最新电影下各个电影标题-电影磁链接
    importrequestsimportreurl='xxx/index2.htm'headers={'user-agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGe......
  • python爬取豆瓣Top250(urlliib+re+bs4+xlwt)
    frombs4importBeautifulSoupimporturllib.request,urllib.errorimportxlwt#进行excel操作importreimporttime#获取电影名的规则findtitle=re.compil......
  • 王者荣耀英雄图片爬取
    王者荣耀英雄图片爬取pyquery库https://pyquery.readthedocs.io/en/latest/官方文档https://github.com/gawel/pyquerygithubpyquery实际上是python中的jquery......
  • 基于SpringBoot WebMagic爬虫爬取大乐透双色球
    大乐透网页地址:https://kjh.55128.cn/dlt-history-360.htm双色球网页地址:https://kjh.55128.cn/ssq-history-120.htm 注:程序仅用于个人兴趣爱好,不得用于商业行为,本......
  • scrapy框架图片爬取案例——以堆糖网为例
    本节主要分享的是scrapy框架中关于图片类的简单爬取方法,在这里只需要用到三个文件:1.setting.py进行scrapy抓取图片所用到的基础。2.duitang_spider.py实现获取多出url进......
  • 爬虫实战---爬取音乐
    爬虫实战---爬取音乐前言:此方法来源于网络:https://www.bilibili.com/video/BV1g8411G7ZC?p=1, 仅供个人学习模块:模块ostkinterwebbrowserrequests......