在Python中,您可以使用requests
库来发送HTTP请求,并使用UserAgent
对象设置请求头中的User-Agent字段,以模拟不同浏览器或设备。以下是一个示例代码,演示如何使用requests
库和fake_useragent
库获取https://www.mafengwo.cn/网页的内容:
首先,确保您已经安装了requests
和fake_useragent
库,您可以使用以下命令进行安装:
pip install requests
pip install fake_useragent
然后,可以使用以下Python代码获取网页内容:
import requests
from fake_useragent import UserAgent
def get_mafengwo_content():
# 创建UserAgent对象
user_agent = UserAgent()
# 设置请求头
headers = {
'User-Agent': user_agent.random
}
# 目标网址
url = 'https://www.mafengwo.cn/'
try:
# 发送GET请求
response = requests.get(url, headers=headers)
http://www.jshk.com.cn/mb/reg.asp?kefu=xiaoding;//爬虫IP免费获取;
# 检查请求是否成功
if response.status_code == 200:
# 打印网页内容
print(response.text)
else:
print(f"Failed to fetch the page. Status code: {response.status_code}")
except Exception as e:
print(f"An error occurred: {e}")
if __name__ == "__main__":
get_mafengwo_content()
上述代码使用fake_useragent
库中的UserAgent
类生成一个随机的User-Agent字符串,并将其设置为请求头。然后,使用requests
库发送GET请求,获取https://www.mafengwo.cn/网页的内容。