寒假生活指导07

时间：2024-01-15 12:56:03浏览次数：52

标签：xpath etree 07 tree 指导 request urllib 寒假 target

今天学习了爬虫

# 导入所需库
import urllib.request
from lxml import etree

# 设置目标URL和请求头信息，模拟Chrome浏览器访问
url = 'https://www.baidu.com/'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36'
}

# 创建一个Request对象并定制请求头
request = urllib.request.Request(url=url, headers=headers)

# 使用urllib.request.urlopen()方法发送请求并获取服务器响应
response = urllib.request.urlopen(request)

# 读取服务器返回的网页内容，并以UTF-8编码解码为字符串
webpage_content = response.read().decode('utf-8')

# 使用lxml.etree库解析HTML内容
html_tree = etree.HTML(webpage_content)

# 使用xpath语法定位到指定元素（例如：获取搜索框的value值）
target_element_value = html_tree.xpath('//input[@id="su"]/@value')[0]
target_element_values = html_tree.xpath('//input[@id="su"]/@type')[0]

# 打印获取的结果
print(target_element_values)

标签：xpath,etree,07,tree,指导,request,urllib,寒假,target
From： https://www.cnblogs.com/syhxx/p/17965137

吴师兄学算法day07 11. 盛最多水的容器
题目：11. 盛最多水的容器难点：如何确定，每次只移动最短边，因为无论移动哪边的柱子，下面的底部一定是缩短的，剩下的就是取决于高度。如果移动的是，两侧高的那个，整体的面积一定是缩小的。如果移动的是，两侧底的那个，后面的柱子有可能是遇到高的，也有可能是低的，所以，整体面积可能大，也可......
吴师兄学算法day07 167. 两数之和 II - 输入有序数组
题目：167. 两数之和II-输入有序数组易错点：下标为1开始我的代码：classSolution:deftwoSum(self,numbers:List[int],target:int)->List[int]:right=len(numbers)-1left=0whileleft<right:ans=numbers[left]......
吴师兄学算法day07 双指针 125. 验证回文串
题目：125. 验证回文串易错点：isaplha()isdigit()lower()要熟悉，挺有用的。我的代码：classSolution:defisPalindrome(self,s:str)->bool:ans=''foriins:ifi.isalpha()ori.isdigit():ans+=i.lower()#......
1.14寒假每日总结5
小型物联网应用系统设计图（模拟器上截图）（2）简述实现过程中的相关步骤及配置各设备配置如下：接入交换机：划分vlan，将终端连接接口划到相应vlan中，开启生成树，开启dhcpsnooping。核心交换机：划分vlan，将设备连接接口修改为trunk接口模式。无线路由器：接口配置ip地址、掩码和......
寒假生活指导06
实验报告题目：Spar机器学习库MLlib编程实践姓名日期2024.1.14实验环境：操作系统：Ubuntu16.04JDK版本：1.7或以上版本Spark版本：2.1.0实验内容与完成情况：1.数据导入从文件中导入数据，并转化为DataFrame。代码：frompyspark.ml.featureimportPCA......
吴师兄学算法day07 双指针 9. 回文数
题目：9. 回文数易错点：右指针要记得移动我的代码：classSolution:defisPalindrome(self,x:int)->bool:array=list(str(x))right=len(array)-1forleftinrange(len(array)//2):ifarray[left]==array[right]:......
读元宇宙改变一切笔记07_硬件与互操作性（上）
1. 元宇宙的头号入口1.1. 元宇宙最令人兴奋的地方在于，我们可以借此开发用来访问、渲染和操纵它的新设备1.1.1. AppNewton于1993年发布，是世界上第一款掌上电脑1.2. 功能超强大又轻巧的AR和沉浸式VR头显1.2.......
寒假生活
什么是Spark? Spark是大数据的调度，监控和分配引擎。它是一个快速通用的集群计算平台.Spark扩展了流行的MapReduce模型.Spark提供的主要功能之一就是能够在内存中运行计算，但对于在磁盘上运行的复杂应用程序，系统也比MapReduce更有效2、Spark部署模式2.1、独立模式在......
大三寒假学习进度笔记4
今日学习时间两小时，开始学习RDD的内容，学习了RDD的创建和RDD算子的定义分类RDD学习：RDD五大特征：RDD是有分区的分区是RDD数据存储的最小单位计算方法会作用到每一个分区上RDD之间是由相互依赖的关系的KV型RDD可以有分区器KV型RDD：存储的数据是二元元组RDD分区数据的读取会尽......
1.13寒假每日总结4
今天，主要尝试了在java中调用已有的python脚本并输出相关信息。参考：百度文心一言的回复。 packagetest0113;importjava.io.*;publicclasstest{publicstaticvoidmain(String[]args){try{//指定Python解释器的路径......

寒假生活指导07

相关文章

赞助商

阅读排行