首页 > 其他分享 >每日总结

每日总结

时间:2023-10-02 22:37:15浏览次数:36  
标签:总结 url 每日 request urllib parse headers data

今天又画了一点的网页。

学习了python的爬虫代码,主要是读别人的代码。

import urllib.request
import urllib.parse


url = 'https://www.baidu.com/s?wd='

# 请求对象的定制为了解决反爬的第一种手段
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36'
}

# 将字变成unicode编码的格式
# 我们需要依赖于urllib.parse
name = urllib.parse.quote('狄仁杰')

url = url + name

# 请求对象的定制
request = urllib.request.Request(url=url,headers=headers)

# 模拟浏览器向服务器发送请求
response = urllib.request.urlopen(request)

# 获取响应的内容
content = response.read().decode('utf-8')

# 打印数据
print(content)

首先确定所要访问的网址,之后进行header的设置,解决反爬,之后需要进行数据的编码格式更改,随后进行数据拼接,定制请求对象,进行请求的发送,获取相应的response,对其进行utf-8的解码,打印数据。

下面是将数据进行unicode的编码格式:

import urllib.parse

data = {
    'wd':'周杰伦',
    'sex':'男',
    'location':'中国台湾省'
}

a = urllib.parse.urlencode(data)
print(a)

下面是演示和以上代码相似的页面爬取显示页面。

import urllib.request
import urllib.parse

base_url = 'https://www.baidu.com/s?'

data = {
    'wd':'周杰伦',
    'sex':'男',
    'location':'中国台湾省'
}

new_data = urllib.parse.urlencode(data)

# 请求资源路径
url = base_url + new_data

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36'
}

# 请求对象的定制
request = urllib.request.Request(url=url,headers=headers)

# 模拟浏览器向服务器发送请求
response = urllib.request.urlopen(request)

# 获取网页源码的数据
content = response.read().decode('utf-8')

# 打印数据
print(content)

 

标签:总结,url,每日,request,urllib,parse,headers,data
From: https://www.cnblogs.com/syhxx/p/17740521.html

相关文章

  • 每日总结
    今日收获今天背了单词!将国庆的作业写完啦!!(当然,后续有了更好的灵感会继续改正和完善);还找了找关于C#的模板;明天预计学习大数据喽!!!背单词!!!备考软考!!再弄一弄C#的那个作业去;......
  • 2023-2024-1 20231305《计算机基础与程序设计》第一周学习总结
    2023-2024-120231305《计算机基础与程序设计》第1周学习总结作业信息这个作业属于哪个课程<班级的链接>(如2022-2023-1-计算机基础与程序设计)这个作业要求在哪里<作业要求的链接>(如2022-2023-1计算机基础与程序设计第一周作业)这个作业的目标<快速浏览一遍教材计......
  • # 2023-2024-1 20231308 《计算机基础与程序设计》第二周学习总结
    2023-2024-120231308《计算机基础与程序设计》第二周学习总结作业信息作业课程2023-2024-1-计算机基础与程序设计作业要求2023-2024-1计算机基础与程序设计第二周作业这个作业的目标学会两本教材第一章的内容,掌握gcc和gdb基本操作作业正文https://www.cnblo......
  • 2023-2024 20231313《计算机基础与程序设计》第一周学习总结
    2023-202420231313《计算机基础与程序设计》第一周学习总结目录作业信息学习内容概括学习方法教材中的问题或感悟《计算机科学概论》第一章《全景图》第二章《二进制数值与计数系统》第三章《数据表示法》第四章《门和电路》第五章《计算部件》第六章《低级程序设计语言与伪代......
  • 2023-2024-1 20231404《计算机基础与程序设计》第一周学习总结
    作业信息1.作业属于哪个课程:https://edu.cnblogs.com/campus/besti/2023-2024-1-CFAP2.这个作业要求在哪里:https://edu.cnblogs.com/campus/besti/2022-2023-1-CFAP/homework/127543.作业的目标:快速浏览教材《计算机科学概论》,提出自己不懂或最想解决的问题4.作业正文:2023-20......
  • 2023-2024-1 20231326《计算机基础与程序设计》 第1周学习总结
    2023-2024-120231326《计算机基础与程序设计》第1周学习总结作业信息这个作业属于哪个课程2022-2023-1-计算机基础与程序设计这个作业的要求2022-2023-1计算机基础与程序设计第一周作业这个作业的目标阅览《计算机科学概论(第7版)》,针对每个章节提出疑问作业正......
  • 2023-2024-1 20231411 《计算机基础与程序设计》第一周学习总结
    作业信息这个作业属于哪个课程2022-2023-1-计算机基础与程序设计这个作业要求在哪里2022-2023-1计算机基础与程序设计第一周作业这个作业的目标初步熟悉课本以及对所学内容有所思考作业正文本博客教材学习内容总结本书涉及计算机科学的方方面面,介绍了计......
  • 每日总结
    今日收获将erp管理系统的基本任务完成了(打算去写正常的作业了--这个更能让我成长,学到一些东西);背单词!使用后端的SpringBoot的MVC框架,以及前端的html模板实现了基础版的增删改查的管理系统,也算是为开学的开学考试做个准备!明天预计计划将剩下的erp整完,然后继续学习大数据去!背单......
  • 2023-2024-1 20231426 《计算机基础与程序设计》第一周学习总结
    作业信息这个作业属于哪个课程2022-2023-1-计算机基础与程序设计这个作业要求在哪里2022-2023-1计算机基础与程序设计第一周作业这个作业的目标初步熟悉课本以及对所学内容有所思考作业正文本博客教材学习内容总结本书涉及计算机科学的方方面面,介绍了计......
  • 2023-2024-1 20231301 《计算机基础与程序设计》第一周学习总结
    作业信息课程计算机基础与程序设计要求https://edu.cnblogs.com/campus/besti/2022-2023-1-CFAP目标快速学习计算机科学概论这本书,有一个初步的了解正文https://www.cnblogs.com/czzz567/p/17728636.html教材内容总结学习计算机科学概论教材学习中的问题......