1. 手写第一个 python 爬虫
# 爬虫: 用程序来获取网站上的资源
# 常用 encoding='utf-8' encoding='gbk'
# 1. 导入 urllib.request urlopen 第三方库
from urllib.request import urlopen
# 2. 设置目标网址,并使用urlopen来访问
# 访问完成是有返回数据的 使用resp来接收
url = 'http://www.baidu.com'
resp = urlopen(url)
# encoding('utf-8') 将字节转换为字符串
# 使用 utf-8 编码格式 还有 gbk 格式
# as 起别名
with open('mybaidu.html', mode='w', encoding='utf-8') as f:
f.write(resp.read().decode('utf-8'))
print('over')
2. 手写第一个 python 爬虫
标签:utf,encoding,python,resp,爬虫,urlopen
From: https://www.cnblogs.com/wuqxblog/p/16592250.html