request请求但脚本爬取

时间：2023-08-28 22:55:13浏览次数：34

标签：xpath content 请求 artical title request 爬取 headers class

import requests
from lxml import etree

url = "https://duanzixing.com/"
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.62',
}
res = requests.get(url, headers=headers)
data = res.content.decode()


tree = etree.HTML(data)
artical_list = tree.xpath('//div[@class="content"]/article[@class="excerpt"]')

for artical in artical_list:
    title = artical.xpath('./header/h2/a/text()')[0]
    content = artical.xpath('./p[@class="note"]/text()')[0]
    print(title, content)

标签：xpath,content,请求,artical,title,request,爬取,headers,class
From： https://www.cnblogs.com/khalil12138/p/17663633.html

metrics-server部署后执行kubectl top node报错：the server is currently unable to ha
问题描述执行kubectltopnode报错：查看v1beta1.metrics.k8s.io详情发现如下错误：kubectldescribeapiservicev1beta1.metrics.k8s.io请求metrics接口（返回结果为401）：curl-khttps://172.16.6.10:8443/apis/metrics.k8s.io/v1bea1查看metrics-serverpod日志报错如下：问题处理经过以......
bootstrap页面集成jquery异步请求
jquery技术是对原生js技术的封装和优化，实现页面上的功能能独立的运行和提交给后台程序，相比之前的用表单整体提交数据可以提高系统的性能，加快响应速度。要在项目中使用jquery必须先引入相关的js脚本，在项目中导入这些js脚本文件：导入后接下来再进行相关技术的操作。实现效果，在一个页面......
python request session
python request session try:#verify参数来解决ssl报错问题request_result=self.request_sess.post(url,data,verify=False)print(request_result)exceptExceptionase3:print("数据提交失败，异常信息{str(e3)}") ######......
05 Ajax请求（扩展，延伸）
05Ajax请求（扩展，延伸）首先,我们用Flask创建一个后台服务器(自己做网站了哈)目录结构:服务端：fromflaskimportFlask,render_template,request#pipinstallFlaskapp=Flask(__name__)@app.route("/")defindex():#跳转到首页print("你曾经来过服务器"......
在低代码平台执行 API 请求并将结果显示在页面上
低代码开发平台（Low-CodeDevelopmentPlatform）是一种用于构建应用程序的软件开发环境，它允许开发者通过图形化的方式，而非传统的手动编码方式来创建应用程序。这种方式大大减少了开发应用程序所需的代码量，因此称为低代码。低代码平台的核心是其拖放式的用户界面，这允许开发者通过直......
websphere服务器对请求的解码配置
tomcat、jboss服务器处理uri的解码方式是可配置的，在server.xml，具体路径不详述了，有一个uriencoding=“utf-8”,用起来很方便，但是websphere死活找不到类似的配置。经查阅资料，weblogic、websphere服务器这种重量级的j2ee服务器，weblogic是默认就是用utf-8来处理的请求的，websphere如果......
python+playwright 学习-77 playwright 发送接口请求APIRequestContext
前言每个Playwright浏览器上下文都有与其关联的APIRequestContext实例，该实例与浏览器上下文共享cookie存储，可以通过browser_context.request或page.request访问。也可以通过调用api_request.new_context（）手动创建一个新的APIRequest上下文实例。通过浏览器发请求可以通过browser......
用P3P解决IE的iframe中每次跨域请求产生新session的问题
初来乍到，看到一篇cookie夸域的帖子，觉的他只是解决了跨二级域名的问题，自己曾经作过一个企业应用的sso，其中用到的p3p解决了cookie跨域的存取。第一次发帖，请各位高手多多指教首先介绍第一方Cookie和第三方cookie: 第一方Cookie是来自当前正在查看的网站，或者发送到当前正在查看的......
Python+Requests示例记录【2023-08-27】
importrequestsimportjsonpayload={"userNo":"用户","password":"密码"}response=requests.post(url,json=payload)print(response)print('---------------------------')print(response.status_code)print('......
淘宝app商品详情原数据接口API（支持高并发请求/免费测试）
item_get_app-获得淘宝app商品详情原数据进入API测试一、引言随着移动互联网的迅速发展，移动电商应用的需求也在不断增长。淘宝作为中国最大的电商平台之一，每天需要处理大量的商品数据和用户访问请求。为了提供更加优质的用户体验，淘宝开放了商品详情原数据接口API，支持开发者在淘......

request请求但脚本爬取

相关文章

赞助商

阅读排行