以下是一个简单的爬虫案例,用于从网页上爬取图片并保存到本地:
```python
import requests
from bs4 import BeautifulSoup
import os
# 创建一个文件夹用于保存图片
if not os.path.exists('images'):
os.makedirs('images')
# 网页URL
url = 'https://www.example.com'
# 发送HTTP请求
response = requests.get(url)
# 使用BeautifulSoup解析网页
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有的图片标签
images = soup.find_all('img')
# 遍历所有的图片标签
for image in images:
# 获取图片URL
image_url = image['src']
# 发送HTTP请求下载图片
image_response = requests.get(image_url)
# 提取图片名称
image_name = image_url.split('/')[-1]
# 图片保存路径
image_path = os.path.join('images', image_name)
# 保存图片到本地
with open(image_path, 'wb') as fp:
fp.write(image_response.content)
print(f'{image_name} 下载完成!')
```
请注意,这只是一个简单的示例,用于展示爬虫的基本原理和操作步骤。实际使用爬虫时,请遵守法律法规,并尊重网站的使用规则和隐私政策。
标签:写个,url,image,爬虫,案例,images,path,response,图片 From: https://blog.csdn.net/GaoXinPan/article/details/139720877