python爬取指定网址图片代码

时间：2024-04-28 14:55:44浏览次数：37

标签：src name img python 爬取网址 url response 图片

代码

import os
import requests
from bs4 import BeautifulSoup

# 指定要爬取的网址
url = 'https://www.baidu.com/'

# 请求网页内容
response = requests.get(url)
response.raise_for_status()  # 如果请求失败，将抛出异常

# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')

# 创建存储图片的文件夹
folder_name = r'F:\jingguan\tu'
if not os.path.exists(folder_name):
    os.makedirs(folder_name)

# 找到网页中的所有<img>标签
img_tags = soup.find_all('img')

# 遍历所有的<img>标签，下载图片
for img in img_tags:
    src = img.get('src')  # 获取图片的src属性
    if src:
        # 完整的图片URL
        img_url = src if src.startswith(('http:', 'https:')) else url + src
        try:
            # 发送请求获取图片内容
            img_response = requests.get(img_url)
            img_response.raise_for_status()

            # 图片文件名
            img_name = os.path.join(folder_name, img_url.split('/')[-1])
            with open(img_name, 'wb') as f:
                f.write(img_response.content)
            print(f"图片已下载：{img_name}")
        except requests.exceptions.RequestException as e:
            print(f"下载图片时出错：{e}")

print("图片下载完成。")

标签：src,name,img,python,爬取,网址,url,response,图片
From： https://www.cnblogs.com/jingzaixin/p/18163719

python将图片添加到视频底层中
代码：importcv2importnumpyasnpimportosimportrandom#图片文件夹路径image_folder_path='path_to_your_images_folder'#视频文件所在的文件夹路径video_folder_path='path_to_your_videos_folder'#输出视频文件夹路径（如果不存在则创建）output_folder_pat......
python篇--创建桌面快捷方式
创建快捷方式import osfrom win32com.client import Dispatchdef create_shortcut(target_path, shorcut_path): shell = Dispatch('WScript.Shell') shortcut = shell.CreateShortcut(shorcut_path) shortcut.TargetPath = target_path ......
脚本语言系列之Python | python练习题最全题库（1）
脚本语言系列之Python|python练习题最全题库（1）脚本语言系列之Python|python练习题最全题库（1）精选python语言基础的填空题400+，并附有答案，初学者一定要刷一遍。刷题前，可以先看一遍基础知识点，已梳理好，移步：测试allen说：脚本语言系列之Python|系列文章传送门这......
Python: Regular expressions
#引用库importre正则表达式的方式#1.re.compile():该函数用于生成一个正则表达式，也就是匹配的核心部分，用来定义你需要怎么匹配，匹配什么内容，更多细节可以去参看菜鸟教程。#2.re.findall():该函数用于在指定的字符串中进行匹配。#str1='lukfook8-hon......
python可复用代码（连接数据库/字符串处理/爬虫/日志配置）【1】
importpymysqlimportloggingimporttimeimportrandomimportloggingimportrequestsfrombs4importBeautifulSoup"""获取数据库连接"""#连接数据库获取游标defget_conn():""":return:连接，游标""&qu......
Alibaba Cloud Linux release 3 Python 3.8 安装
AlibabaCloudLinuxrelease3Python3.8安装https://zhuanlan.zhihu.com/p/690125733背景买了台阿里云服务器玩玩，项目需要Python3.8，但是机器上配置了3.6.8机器信息：机器信息：Linuxversion5.10.134-16.1.al8.x86_64AlibabaCloudLinuxrelease3linux的多python版......
Python中有很多库可以操作Excel，像xlsxwriter、openpyxl、pandas、xlwings等
Python中确实有多个库可以用于操作Excel文件，包括但不限于xlsxwriter、openpyxl、pandas和xlwings。以下是这些库的简要介绍和它们各自的优点：xlsxwriter:优点:专门用于创建新的.xlsx文件。提供了丰富的功能来创建复杂的Excel文档，包括图表、图片、自动筛选等。性能相对较......
11个Python循环技巧
本文分享自华为云社区《Python中的循环技巧指南》，作者：柠檬味拥抱。当我们处理数据时，有时候需要创建多个列表以存储不同类型或不同条件下的数据。在Python中，我们可以利用循环来快速、高效地创建这些列表。本文将介绍如何使用循环在Python中创建多个列表，并提供代码实例。python用......
MBIST和BISR+循环移位和强制转换+verdi操作+vip需要disable auto recording+vim设置某
MBIST和BISRhttps://blog.csdn.net/liubin1222/article/details/103995449https://zhuanlan.zhihu.com/p/161185302进行内存修复需要两步：首先在可修复内存测试期间，由MBIST控制器诊断出的故障。第二步是修复内存，确认修复签名。可修复的存储器都有带修复签名的寄存器。MBIST(Me......
[Python急救站]人脸识别技术练习
这段时间做了一个用于初学者学习人脸识别系统的程序，在上代码时，先给说说事前准备：首先我们需要一个OpenCV的一个haarcascade_frontalface_default.xml文件，只要去GitHub上面即可下载：https://github.com/opencv/opencv点击Code，选择DownloadZIP，下载后解压在目录下opencv-4.x\data\ha......

python爬取指定网址图片代码

相关文章

赞助商

阅读排行