首页 > 其他分享 >寒假生活指导07

寒假生活指导07

时间:2024-01-15 12:56:03浏览次数:51  
标签:xpath etree 07 tree 指导 request urllib 寒假 target

 今天学习了爬虫

# 导入所需库
import urllib.request
from lxml import etree

# 设置目标URL和请求头信息,模拟Chrome浏览器访问
url = 'https://www.baidu.com/'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36'
}

# 创建一个Request对象并定制请求头
request = urllib.request.Request(url=url, headers=headers)

# 使用urllib.request.urlopen()方法发送请求并获取服务器响应
response = urllib.request.urlopen(request)

# 读取服务器返回的网页内容,并以UTF-8编码解码为字符串
webpage_content = response.read().decode('utf-8')

# 使用lxml.etree库解析HTML内容
html_tree = etree.HTML(webpage_content)

# 使用xpath语法定位到指定元素(例如:获取搜索框的value值)
target_element_value = html_tree.xpath('//input[@id="su"]/@value')[0]
target_element_values = html_tree.xpath('//input[@id="su"]/@type')[0]

# 打印获取的结果
print(target_element_values)

 

标签:xpath,etree,07,tree,指导,request,urllib,寒假,target
From: https://www.cnblogs.com/syhxx/p/17965137

相关文章

  • 吴师兄学算法day07 11. 盛最多水的容器
    题目:11. 盛最多水的容器难点:如何确定,每次只移动最短边,因为无论移动哪边的柱子,下面的底部一定是缩短的,剩下的就是取决于高度。如果移动的是,两侧高的那个,整体的面积一定是缩小的。如果移动的是,两侧底的那个,后面的柱子有可能是遇到高的,也有可能是低的,所以,整体面积可能大,也可......
  • 吴师兄学算法day07 167. 两数之和 II - 输入有序数组
    题目:167. 两数之和II-输入有序数组易错点:下标为1开始我的代码:classSolution:deftwoSum(self,numbers:List[int],target:int)->List[int]:right=len(numbers)-1left=0whileleft<right:ans=numbers[left]......
  • 吴师兄学算法day07 双指针 125. 验证回文串
    题目:125. 验证回文串易错点:isaplha()isdigit()lower()要熟悉,挺有用的。我的代码:classSolution:defisPalindrome(self,s:str)->bool:ans=''foriins:ifi.isalpha()ori.isdigit():ans+=i.lower()#......
  • 1.14寒假每日总结5
    小型物联网应用系统设计图(模拟器上截图)   (2)简述实现过程中的相关步骤及配置各设备配置如下:接入交换机:划分vlan,将终端连接接口划到相应vlan中,开启生成树,开启dhcpsnooping。核心交换机:划分vlan,将设备连接接口修改为trunk接口模式。无线路由器:接口配置ip地址、掩码和......
  • 寒假生活指导06
    实验报告题目:Spar机器学习库MLlib编程实践姓名 日期2024.1.14实验环境:操作系统:Ubuntu16.04JDK版本:1.7或以上版本Spark版本:2.1.0实验内容与完成情况:1.数据导入从文件中导入数据,并转化为DataFrame。代码:frompyspark.ml.featureimportPCA......
  • 吴师兄学算法day07 双指针 9. 回文数
    题目:9. 回文数易错点:右指针要记得移动我的代码:classSolution:defisPalindrome(self,x:int)->bool:array=list(str(x))right=len(array)-1forleftinrange(len(array)//2):ifarray[left]==array[right]:......
  • 读元宇宙改变一切笔记07_硬件与互操作性(上)
    1.      元宇宙的头号入口1.1.        元宇宙最令人兴奋的地方在于,我们可以借此开发用来访问、渲染和操纵它的新设备1.1.1.          AppNewton于1993年发布,是世界上第一款掌上电脑1.2.        功能超强大又轻巧的AR和沉浸式VR头显1.2.......
  • 寒假生活
    什么是Spark?   Spark是大数据的调度,监控和分配引擎。它是一个快速通用的集群计算平台.Spark扩展了流行的MapReduce模型.Spark提供的主要功能之一就是能够在内存中运行计算,但对于在磁盘上运行的复杂应用程序,系统也比MapReduce更有效2、Spark部署模式2.1、独立模式 在......
  • 大三寒假学习进度笔记4
    今日学习时间两小时,开始学习RDD的内容,学习了RDD的创建和RDD算子的定义分类RDD学习:RDD五大特征:RDD是有分区的分区是RDD数据存储的最小单位计算方法会作用到每一个分区上RDD之间是由相互依赖的关系的KV型RDD可以有分区器KV型RDD:存储的数据是二元元组RDD分区数据的读取会尽......
  • 1.13寒假每日总结4
    今天,主要尝试了在java中调用已有的python脚本并输出相关信息。 参考:百度文心一言的回复。 packagetest0113;importjava.io.*;publicclasstest{publicstaticvoidmain(String[]args){try{//指定Python解释器的路径......