首页 > 其他分享 >xpath提取二手房

xpath提取二手房

时间:2023-02-12 15:44:29浏览次数:33  
标签:xpath 提取 section list 二手房 div property class

xpath提取二手房

#利用xpath提取二手房
import requests
from lxml import etree
url='https://bj.58.com/ershoufang/'
head={
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36 Edg/95.0.1020.40'
}
htmltext=requests.get(url=url,headers=head).text
parse=etree.HTMLParser(encoding='utf-8')
tree=etree.HTML(htmltext,parser=parse)
l=tree.xpath('/body/div/@id="__nuxt"/div/@id="__layout"/div/@class="list"/section/@class="list-body"/section/@class="list-main"/section/@class="list-left"/section/@class="list"/a/@class="property-ex"/div/@class="property-content"/div/@class="property-content-detail"/div/@class="property-content-title"/h3/text()')
print(l)


标签:xpath,提取,section,list,二手房,div,property,class
From: https://www.cnblogs.com/tgfoven/p/17113895.html

相关文章

  • python使用lxml库进行本地html文件的内容提取
    从某些网站上得到了一些考试题目,但是人家的排版时:题目、选项、正确答案怎么才能把题目都提取到文件的一列,选项提取到一列,答案提取到一列呢?使用了lxml这个库,不过这个库需......
  • 提取目标jar文件中的内容到指定目录
    jdk为11importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.nio.file.Files;importjava.n......
  • javascript 提取字符串方法 slice substr substring
    本文将对javascript提取字符串的三个方法slice/substr/substring,进行分析。这三个方法都具有提取字符串的功能,且都有两个参数。下面将详细介绍三个方法在一些特殊参数值......
  • 如何提取苹果手机上安装的软件的ipa?
    当打包完ipa文件后,ipa文件无法直接安装,只能添加udid安装到手机,或者上架才能安装,这里,我分享下使用本站工具上传ipa到appstore,无需mac电脑完成ipa文件上架的详细步骤:1、首先,......
  • Webpack提取页面公共资源
    1.利用html-webpack-externals-plugin分离基础库在做React开发时,经常需要引入react和react-dom基础库,这样在打包的时候速度就会比较慢,这种情况下我们可以将这些基础库忽略......
  • 第7课、元素定位-xpath语句
                                   ......
  • Jmeter-后置处理器-json提取器(相对路径${..date})与正则提取器(万能表达式.*?)
    1、json提取器-相对路径以及多个参数(写默认值)  如果你的响应体为json格式,那么优先选用json提取器如果想要提前请求中内容、响应的头部内容、或者响应体格式非json格......
  • 数据采集技术之在Python中Libxml模块安装与使用XPath
    为了使用XPath技术,对爬虫抓取的网页数据进行抽取(如标题、正文等等),之后在Windows下安装libxml2模块(安装后使用的是Libxml模块),该模块含有xpath。准备需要的软件包:Python2.7......
  • sed实现从gff文件的第9列提取基因名称
     001、[root@PC1test]#lsa.txt[root@PC1test]#cata.txt##测试数据ID=gene-LOC124418406;Dbxref=GeneID:124418406;Name=LOC124418406;gbkey=Gene;gene=L......
  • 关键词提取
     一般来说,TF-IDF算法和TextRank算法就可以满足大部分的关键词提取任务。但是在某些场景,基于文档本身的关键词提取还不是非常足够,有些关键词不一定会显式的出现在文档中,对于......