首页 > 编程语言 >python爬取指定网址图片代码

python爬取指定网址图片代码

时间:2024-04-28 14:55:44浏览次数:34  
标签:src name img python 爬取 网址 url response 图片

代码

import os
import requests
from bs4 import BeautifulSoup

# 指定要爬取的网址
url = 'https://www.baidu.com/'

# 请求网页内容
response = requests.get(url)
response.raise_for_status()  # 如果请求失败,将抛出异常

# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')

# 创建存储图片的文件夹
folder_name = r'F:\jingguan\tu'
if not os.path.exists(folder_name):
    os.makedirs(folder_name)

# 找到网页中的所有<img>标签
img_tags = soup.find_all('img')

# 遍历所有的<img>标签,下载图片
for img in img_tags:
    src = img.get('src')  # 获取图片的src属性
    if src:
        # 完整的图片URL
        img_url = src if src.startswith(('http:', 'https:')) else url + src
        try:
            # 发送请求获取图片内容
            img_response = requests.get(img_url)
            img_response.raise_for_status()

            # 图片文件名
            img_name = os.path.join(folder_name, img_url.split('/')[-1])
            with open(img_name, 'wb') as f:
                f.write(img_response.content)
            print(f"图片已下载:{img_name}")
        except requests.exceptions.RequestException as e:
            print(f"下载图片时出错:{e}")

print("图片下载完成。")

 

标签:src,name,img,python,爬取,网址,url,response,图片
From: https://www.cnblogs.com/jingzaixin/p/18163719

相关文章

  • python将图片添加到视频底层中
    代码:importcv2importnumpyasnpimportosimportrandom#图片文件夹路径image_folder_path='path_to_your_images_folder'#视频文件所在的文件夹路径video_folder_path='path_to_your_videos_folder'#输出视频文件夹路径(如果不存在则创建)output_folder_pat......
  • python篇--创建桌面快捷方式
    创建快捷方式import osfrom win32com.client import Dispatchdef create_shortcut(target_path, shorcut_path):    shell = Dispatch('WScript.Shell')    shortcut = shell.CreateShortcut(shorcut_path)    shortcut.TargetPath = target_path    ......
  • 脚本语言系列之Python | python练习题最全题库(1)
    脚本语言系列之Python|python练习题最全题库(1)脚本语言系列之Python|python练习题最全题库(1) 精选python语言基础的填空题400+,并附有答案,初学者一定要刷一遍。刷题前,可以先看一遍基础知识点,已梳理好,移步:测试allen说:脚本语言系列之Python|系列文章传送门这......
  • Python: Regular expressions
     #引用库importre正则表达式的方式#1.re.compile():该函数用于生成一个正则表达式,也就是匹配的核心部分,用来定义你需要怎么匹配,匹配什么内容,更多细节可以去参看菜鸟教程。#2.re.findall():该函数用于在指定的字符串中进行匹配。#str1='lukfook8-hon......
  • python可复用代码(连接数据库/字符串处理/爬虫/日志配置)【1】
    importpymysqlimportloggingimporttimeimportrandomimportloggingimportrequestsfrombs4importBeautifulSoup"""获取数据库连接"""#连接数据库获取游标defget_conn():""":return:连接,游标""&qu......
  • Alibaba Cloud Linux release 3 Python 3.8 安装
    AlibabaCloudLinuxrelease3Python3.8安装https://zhuanlan.zhihu.com/p/690125733背景买了台阿里云服务器玩玩,项目需要Python3.8,但是机器上配置了3.6.8机器信息:机器信息:Linuxversion5.10.134-16.1.al8.x86_64AlibabaCloudLinuxrelease3linux的多python版......
  • Python中有很多库可以操作Excel,像xlsxwriter、openpyxl、pandas、xlwings等
    Python中确实有多个库可以用于操作Excel文件,包括但不限于xlsxwriter、openpyxl、pandas和xlwings。以下是这些库的简要介绍和它们各自的优点:xlsxwriter:优点:专门用于创建新的.xlsx文件。提供了丰富的功能来创建复杂的Excel文档,包括图表、图片、自动筛选等。性能相对较......
  • 11个Python循环技巧
    本文分享自华为云社区《Python中的循环技巧指南》,作者:柠檬味拥抱。当我们处理数据时,有时候需要创建多个列表以存储不同类型或不同条件下的数据。在Python中,我们可以利用循环来快速、高效地创建这些列表。本文将介绍如何使用循环在Python中创建多个列表,并提供代码实例。python用......
  • MBIST和BISR+循环移位和强制转换+verdi操作+vip需要disable auto recording+vim设置某
    MBIST和BISRhttps://blog.csdn.net/liubin1222/article/details/103995449https://zhuanlan.zhihu.com/p/161185302进行内存修复需要两步:首先在可修复内存测试期间,由MBIST控制器诊断出的故障。第二步是修复内存,确认修复签名。可修复的存储器都有带修复签名的寄存器。MBIST(Me......
  • [Python急救站]人脸识别技术练习
    这段时间做了一个用于初学者学习人脸识别系统的程序,在上代码时,先给说说事前准备:首先我们需要一个OpenCV的一个haarcascade_frontalface_default.xml文件,只要去GitHub上面即可下载:https://github.com/opencv/opencv点击Code,选择DownloadZIP,下载后解压在目录下opencv-4.x\data\ha......