首页 > 编程语言 >小白学python爬虫1

小白学python爬虫1

时间:2024-04-05 16:59:05浏览次数:33  
标签:浏览器 python resp 爬虫 url 小白学 print requests 源代码

"""
爬虫:通过编写程序来获取互联网上的资源
需求:用程序模拟浏览器,输入一个网址,从该网址获取到资源或者内容
"""

# from urllib.request import urlopen  # url网址
#
# url = "http://www.baidu.com"
# resp = urlopen(url)
#
# # print(resp.read().decode("utf-8"))  # 字节转字符串  解码用什么可以先print然后找解码
# with open("mybaidu.html", mode="w") as f:
#     f.write(resp.read().decode("utf-8"))  # 读取到网页的页面源代码
# print('over')

"""
web请求全剖析
1、服务器渲染:在服务器那边直接把html和数据整合在一起,统一返回给浏览器
    在页面源代码中能看到数据
2、客户端渲染:第一次请求只要一个html骨架,第二次请求拿到数据,进行数据展示
    在页码源代码中看不到数据
    
熟练使用浏览器抓包工具

协议:就是两个计算机之间为了能偶流畅的进行沟通而设置的一个君子协议
User-Agent:请求载体的身份标识(用啥发送的请求)

请求方式:GET:查询网站  显示提交
        POST:对服务器数据更改  隐式提交
"""
# 安装request
# pip install requests
# 国内源:
# pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests
#下载的时候又遇上一个问题,下载不了,后面发现是下载的python版本过低,去官网重新下载了3.8的就好啦,然后再pycharm中点击右下角有个python版本号的地方点击编辑更改成3.8就行了
query = input("请输入你喜欢的明星")

import requests
url = f'https://cn.bing.com/search?q={query}'

headers = {
    "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36 Edg/123.0.0.0"
}

#这里遇到一个问题,我用的浏览器是微软浏览器,找不到user-agent,虽然可以不改直接用,但我还是想找一下:就这样就能找到啦

resp = requests.get(url, headers=headers)
print(resp)  # <Response [200]>
print(resp.text)  # 拿到页面源代码

标签:浏览器,python,resp,爬虫,url,小白学,print,requests,源代码
From: https://blog.csdn.net/2302_80229179/article/details/137403739

相关文章

  • Python栈和队列
    在计算机科学中,栈(Stack)和队列(Queue)是两种非常重要的数据结构,它们在算法设计和程序开发中扮演着关键角色。Python语言内置了对这两种数据结构的支持,尤其是在其`collections`和`deque`模块中。###栈(Stack)栈是一种后进先出(LastInFirstOut,LIFO)的数据结构,它只允许在一端进行......
  • Python简单函数循环综合实例
    importrandomprint("*"*71)print("*"*27+"欢迎来到名人猜猜猜"+"*"*27)print("*"*29+"Let'sbegining"+"*"*28)character_1='他是巨星'character_2='他是篮球健将'character_3='他身......
  • Python递归调用应用实例-汉诺塔
    递归介绍1.简单的说:递归就是函数自己调用自己,每次调用时传入不同的值2.递归有助于编程者解决复杂问题,同时可以让代码变得简洁汉诺塔传说汉诺塔(又称河内塔)问题是源于印度一个古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石住子,在一根柱子上从上往下按照大小顺......
  • 10个全面了解python自动化办公代码
    10个全面了解python自动化办公代码当涉及自动化工作时,Python是一种非常强大的编程语言.以下是10个用于自动化工作的Python代码示例:文件操作:自动化文件操作可以帮助您批量处理文件、筛选内容等等. import os# 遍历目录下所有文件for root, dirs, files in ......
  • python(8)
    列表(三)列表,通过下标索引的方法,用赋值运算符将新的值替换进去1.改a=["1","2","3","4"]a[2]="5"["1","2","5","4"]a[2:]=["3","6"]  #切片["1","2",&q......
  • Python实参与形参(1)
    1.函数的定义defone():print("123456")print("123456")one()one()结果:1234561234561234561234562.函数的形参、实参应用defone(frist,last):print("你好",frist)iflast>100:print("你考试考的很好")else:......
  • 数学模型,第2章训练题,超市购物,垂钓俱乐部,圆盘加工,动物尺寸,python,论文
    目录      1.题目描述2. 题目描述3.题目描述4.题目描述5.问题描述1. 题目描述在超市购物时你注意到大包装商品比小包装商品便宜这种现象了吗?比如佳洁士牙膏120g装的每支10.80元,200g装的每支15.80元,二者单位质量的价格比是1.14:1。使用比例方法构造模型解......
  • Python面向对象的理解
    ★静态方法、实例方法、类方法项目操作对象调用方式静态方法既不操作类也不操作实例对象类或实例对象实例方法操作实例属性实例对象类方法操作类属性类或实例对象★python私有方法和私有属性理解规律总结1.私有的属性,不能通过对象直接访问,但是可......
  • 二叉树计算【华为OD机试JAVA&Python&C++&JS题解】
    一.题目-二叉树计算给出一个二叉树如下图所示:6/79\/-26请由该二叉树生成一个新的二叉树,它满足其树中的每个节点将包含原始树中的左子树和右子树的和。20(7-2+9+6)/\-26\/......
  • 学生重新排队【华为OD机试JAVA&Python&C++&JS题解】
    一.题目-学生重新排队n个学生排成一排,学生编号分别是1到n,n为3的整倍数。老师随机抽签决定将所有学生分成m个3人的小组,n=3*m为了便于同组学生交流,老师决定将小组成员安排到一起,也就是同组成员彼此相连,同组任意两个成员输入描述:之间无其它组的成员。因此老师决定调整队伍,......