[学习笔记]python爬虫初体验

时间：2023-07-07 22:44:33浏览次数：41

标签：初体验 python 爬虫 content url print response

同学吹水，提到了爬虫，于是金工实习回来晚上看了看爬虫
（话说为啥所有爬虫教程前面都是一大串python基础教程啊）

import urllib.request
#1、定义一个网址url
url='http://www.baidu.com'
#2、模拟浏览器向服务器发送请求
response = urllib.request.urlopen(url)

print(type(response))

#一个字节一个字节读入 
# content = response.read()
#读取括号内个字节的字符
# content = response.read(5)
#一行读取
# content = response.readline()
#一行一行读取，直到最后
# content = response.readlines()

#获得html状态码
# print(response.getcode())

#获得地址
# print(response.geturl())

#获得headers
print(response.getheaders())

标签：初体验,python,爬虫,content,url,print,response
From： https://www.cnblogs.com/ajmddzp/p/17536237.html

[oeasy]python0071_字符串类型_str_string_下标运算符_中括号
回忆上次内容上次分辨了静态类型语言动态类型语言 python属于对类型要求没有那么严格的动态类型语言对初学者很友好不过很多时候也容易弄不清变量类型直接修改代码增强程序的可读性把变量的类型明确标......
python命令
目录进入项目文件终端：cmd进去目标文件：cd查找当前盘或者文件下面的目录：dirnull进入项目文件终端：cmd进去目标文件：cd查找当前盘或者文件下面的目录：dir//创建项目工程：django-adminstartprojectCarApp：pythonmanage.pystartappblog//配置用户信息pythonmanage.pycre......
，软件运行监听地址，扫码登录，爬虫介绍，requests模块介绍和快速使用，get请求携带参数，编码
补充#软件运行，监听地址127.0.0.1 只能访问127.0.0.1localhost不能用本机ip地址访问，外部所有人都不能访问你0.0.0.0 127.0.0.1localhost本机ip地址访问同一个局域网内，都可以通过ip地址访问#本地host解析输入网址---》www.baidu.com---->找本地host文......
python: PyQt5 beginner
fromPyQt5.QtWidgetsimportQWidget,QApplication,QMainWindow,QLabel,QPushButtonfromPyQt5importQtCore,QtGuiimportsysimportosdefclick():print("HyButtonisclicked!")#Pressthegreenbuttonintheguttertorunthescri......
Python | glob模块使用
glob模块简介glob模块可以查找符合特定规则的文件路径名，用来查找文件目录和文件，并将搜索的到的结果返回到一个列表中。常见的两个方法有glob.glob()和glob.iglob()，类似windows下的文件搜索。glob支持*?[]这三种通配符。glob模块的使用导入方法：importglob #导入整个glob模......
python基础day40
GIL全局解释器锁python在设计之初就考虑到在主循环中，同时只有一个线程在执行。虽然Python解释器中可以“运行”多个线程，但在任意时刻只有一个线程在解释器中运行。对Python虚拟机的访问由全局解释器锁(GIL)来控制，正是这个锁能保证同一时刻只有一个线程在运行。1.python代码......
python字典（二）- 嵌套
1.字典列表alien_0={'color':'green','points':5}alien_1={'color':'yellow','points':10}alien_2={'color':'red','points':15}aliens=[alien_0,alien_1,alie......
Python 引用问题 - ImportError: attempted relative import with no known parent pa
问题描述近日在尝试引用其他文件的代码时，遇到了错误:ImportError:attemptedrelativeimportwithnoknownparentpackage.问题大致是这样的：我想在code2.py中引用code1.py的函数，如from..folder1.code1importxxx，运行code2.py时出现错误。root├──folder1│......
python函数进阶
Python函数进阶一、函数多返回值1.1多个返回值如果一个函数要有多个返回值，该如何书写代码？"""演示函数的多返回值示例"""#演示使用多个变量，接受多个返回值deftest_return():return1,"hello",Truex,y,z=test_return()print(x)#1print(y)#hello......
爬虫第一天基础
目录1前戏2爬虫介绍3requests模块介绍和快速使用4get请求携带参数5编码和解码6携带请求头7发送post请求，携带数据8携带cookie两种方式1前戏#介绍：使用requests可以模拟浏览器的请求，比起之前用到的urllib，requests模块的api更加便捷（本质就是封装了urllib3）#注意：requests库......

[学习笔记]python爬虫初体验

相关文章

赞助商

阅读排行