首页 > 其他分享 >request请求但脚本爬取

request请求但脚本爬取

时间:2023-08-28 22:55:13浏览次数:29  
标签:xpath content 请求 artical title request 爬取 headers class

import requests
from lxml import etree

url = "https://duanzixing.com/"
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.62',
}
res = requests.get(url, headers=headers)
data = res.content.decode()


tree = etree.HTML(data)
artical_list = tree.xpath('//div[@class="content"]/article[@class="excerpt"]')

for artical in artical_list:
title = artical.xpath('./header/h2/a/text()')[0]
content = artical.xpath('./p[@class="note"]/text()')[0]
print(title, content)

标签:xpath,content,请求,artical,title,request,爬取,headers,class
From: https://www.cnblogs.com/khalil12138/p/17663633.html

相关文章

  • metrics-server部署后执行kubectl top node报错:the server is currently unable to ha
    问题描述执行kubectltopnode报错:查看v1beta1.metrics.k8s.io详情发现如下错误:kubectldescribeapiservicev1beta1.metrics.k8s.io请求metrics接口(返回结果为401):curl-khttps://172.16.6.10:8443/apis/metrics.k8s.io/v1bea1查看metrics-serverpod日志报错如下:问题处理经过以......
  • bootstrap页面集成jquery异步请求
    jquery技术是对原生js技术的封装和优化,实现页面上的功能能独立的运行和提交给后台程序,相比之前的用表单整体提交数据可以提高系统的性能,加快响应速度。要在项目中使用jquery必须先引入相关的js脚本,在项目中导入这些js脚本文件:导入后接下来再进行相关技术的操作。实现效果,在一个页面......
  • python request session
    python request session try:#verify参数来解决ssl报错问题request_result=self.request_sess.post(url,data,verify=False)print(request_result)exceptExceptionase3:print("数据提交失败,异常信息{str(e3)}")     ######......
  • 05 Ajax请求(扩展,延伸)
    05Ajax请求(扩展,延伸)首先,我们用Flask创建一个后台服务器(自己做网站了哈)目录结构:服务端:fromflaskimportFlask,render_template,request#pipinstallFlaskapp=Flask(__name__)@app.route("/")defindex():#跳转到首页print("你曾经来过服务器"......
  • 在低代码平台执行 API 请求并将结果显示在页面上
    低代码开发平台(Low-CodeDevelopmentPlatform)是一种用于构建应用程序的软件开发环境,它允许开发者通过图形化的方式,而非传统的手动编码方式来创建应用程序。这种方式大大减少了开发应用程序所需的代码量,因此称为低代码。低代码平台的核心是其拖放式的用户界面,这允许开发者通过直......
  • websphere服务器对请求的解码配置
    tomcat、jboss服务器处理uri的解码方式是可配置的,在server.xml,具体路径不详述了,有一个uriencoding=“utf-8”,用起来很方便,但是websphere死活找不到类似的配置。 经查阅资料,weblogic、websphere服务器这种重量级的j2ee服务器,weblogic是默认就是用utf-8来处理的请求的,websphere如果......
  • python+playwright 学习-77 playwright 发送接口请求APIRequestContext
    前言每个Playwright浏览器上下文都有与其关联的APIRequestContext实例,该实例与浏览器上下文共享cookie存储,可以通过browser_context.request或page.request访问。也可以通过调用api_request.new_context()手动创建一个新的APIRequest上下文实例。通过浏览器发请求可以通过browser......
  • 用P3P解决IE的iframe中每次跨域请求产生新session的问题
    初来乍到,看到一篇cookie夸域的帖子,觉的他只是解决了跨二级域名的问题,自己曾经作过一个企业应用的sso,其中用到的p3p解决了cookie跨域的存取。 第一次发帖,请各位高手多多指教 首先介绍第一方Cookie和第三方cookie: 第一方Cookie是来自当前正在查看的网站,或者发送到当前正在查看的......
  • Python+Requests示例记录【2023-08-27】
    importrequestsimportjsonpayload={"userNo":"用户","password":"密码"}response=requests.post(url,json=payload)print(response)print('---------------------------')print(response.status_code)print('......
  • 淘宝app商品详情原数据接口API(支持高并发请求/免费测试)
    item_get_app-获得淘宝app商品详情原数据 进入API测试一、引言随着移动互联网的迅速发展,移动电商应用的需求也在不断增长。淘宝作为中国最大的电商平台之一,每天需要处理大量的商品数据和用户访问请求。为了提供更加优质的用户体验,淘宝开放了商品详情原数据接口API,支持开发者在淘......