首页 > 其他分享 >线程与队列

线程与队列

时间:2022-11-18 13:24:32浏览次数:33  
标签:img get 队列 self queue 线程 page

一、线程安全队列

python内置的线程安全队列模块叫queue

python的Queue模块中提供了同步的、线程安全的队列类

FIFO(先进先出)队列的Queue(常用)

LIFO(后进先出)lifoQueue

可以使用队列来实现线程间的同步。

二、队列的常用方法

函数 描述
qsize() 返回队列大小
empty() 判断队列是否为空
full() 判断队列是否满了
get() 从队列中获取先插入的数据
put() 将一个数据放到队列中
  • qsize()返回队列大小
from queue import Queue
# 指定队列当中最多可存放5个数据
queue = Queue(5)
for num in range(5):
    # put()将一个数据放到队列中

    queue.put(num)   # 队列中获取先插入的数据
print("当前队列的大小为:", queue.qsize())

-------------------------
当前队列的大小为: 5
  • empty()判断队列是否为空
  • full() 判断队列是否为满
from queue import Queue
# 指定队列当中最多可存放5个数据
queue = Queue(5)
for num in range(5):
    # put()将一个数据放到队列中

    queue.put(num)   # 队列中获取先插入的数据

# 判断队列是否为空
print(queue.empty())
print(queue.full())

----------------------
False
True
  • put() 将一个数据放到队列中
  • get() 从队列中获取先插入的数据 

     

from queue import Queue
# 指定队列当中最多可存放5个数据
queue = Queue(5)
for num in range(5):
    # put()将一个数据放到队列中

    queue.put(num)   # 队列中获取先插入的数据
print("当前队列的大小为:", queue.qsize())
# get()从队列中获取先插入的数据
for i in range(1,6):
    print(queue.get(i))
    
-------------------------------------
当前队列的大小为: 5
0
1
2
3
4

三、在多线程当中使用

Queue是线程安全的队列,在使用时无须加锁,可以再多线程当中直接使用

队列也是实现线程间同步的方式

from queue import Queue
import threading
import random
import time

def put_data(queue):
    while True:
        queue.put(random.randint(10,100))
        time.sleep(1)
        print(queue.qsize())
def get_data(queue):
    while True:
        print(f"已经获取到队列当中的--{queue.get()}--元素")

def main():
    queue = Queue(10)
    t1 = threading.Thread(target=put_data,args=(queue,))
    t2 = threading.Thread(target=get_data,args=(queue,))
    t1.start()
    t2.start()

if __name__ == '__main__':
    main()

四、生产者与消费者模式

产生数据的模块,就形象地称为生产者;而处理数据的模块,就称为消费者。

单单抽象出生产者和消费者,还够不上是生产者/消费者模式。该模式还需要有一个缓冲区处于生产者和消费者之间,作为一个中介。生产者把数据放入缓冲区,而消费者从缓冲区取出数据。

  • 缓冲区

如果制造数据的速度时快时慢,缓冲区的好处就体现出来了。当数据制造快的时候,消费者来不及处理,未处理的数据可以暂时存在缓冲区中。等生产者的制造速度慢下来,消费者再慢慢处理掉。

  • 队列==缓冲区

(一)生产者与消费者模式案例

import requests
from bs4 import BeautifulSoup
import os
from threading import Thread
from queue import Queue


headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36 Edg/107.0.1418.26"}

# 生产者类

class Page_Url(Thread):
    # page_queue 生产者队列
    # img_queue 消费者队列
    def __init__(self,page_queue,img_queue):
        super().__init__()
        self.page_queue = page_queue
        self.img_queue = img_queue

    def run(self):
        while True:
            if self.page_queue.empty():
                break
            url = self.page_queue.get()
            self.download_image(url)

    def download_image(self,url):

        resp = requests.get(url, headers=headers).text
        # print(resp)
        soup = BeautifulSoup(resp, "lxml")
        image_list = soup.find_all("img", class_="ui image lazy")
        for img in image_list:
            title = img.get("title")
            href = img.get("data-original")
            self.img_queue.put((title,href))

# 消费者类
class Img_Url(Thread):
    # page_queue 生产者队列
    # img_queue 消费者队列
    def __init__(self, page_queue, img_queue):
        super().__init__()
        self.page_queue = page_queue
        self.img_queue = img_queue
    def run(self):
        while True:
            data = self.img_queue.get()
            title,href = data
            try:
                with open("./image/"+title+os.path.splitext(href)[-1],"wb") as f:
                    resp =requests.get(href).content
                    f.write(resp)
                    print(title,"保存成功!")
            except OSError:
                pass
            # 判断两个队列是否全部清空
            if self.page_queue.empty() and self.img_queue.empty():
                break




def main():
    # 创建两个队列
    page_queue = Queue()
    img_queue = Queue()

    for num in range(1,6):
        url = "https://www.fabiaoqing.com/biaoqing/lists/page/{}.html".format(num)
        # 将前五页的url添加到生产者队列
        page_queue.put(url)

    t1 = Page_Url(page_queue,img_queue)
    t1.start()
    t2 = Img_Url(page_queue,img_queue)
    t2.start()

if __name__ == '__main__':
    main()

 

(二)步骤解析

1、主类main

(1)创建生产者与消费者队列

(2)将前5页的url添加到生产者队列

def main():
    # 创建两个队列
    page_queue = Queue()
    img_queue = Queue()

    for num in range(1,6):
        url = "https://www.fabiaoqing.com/biaoqing/lists/page/{}.html".format(num)
        # 将前五页的url添加到生产者队列
        page_queue.put(url)

    t1 = Page_Url(page_queue,img_queue)
    t1.start()
    t2 = Img_Url(page_queue,img_queue)
    t2.start()

2、生产者类

(1)生产者队列while循环当中获取的前5页的链接,当队列为空,停止获取。

    def run(self):
        while True:
            if self.page_queue.empty():
                break
            url = self.page_queue.get()
            self.download_image(url)

(2)将获取的链接给到dowl_img

def download_image(self,url):

    resp = requests.get(url, headers=headers).text
    # print(resp)
    soup = BeautifulSoup(resp, "lxml")
    image_list = soup.find_all("img", class_="ui image lazy")
    for img in image_list:
        title = img.get("title")
        href = img.get("data-original")

(3)将获取到的名称和链接添加到消费者队列

self.img_queue.put((title,href))

3、消费者类

(1)从队列当中获取图片名称和链接

def run(self):
    while True:
        data = self.img_queue.get()
        title,href = data

(2)保存图片

try:
    with open("./image/"+title+os.path.splitext(href)[-1],"wb") as f:
        resp =requests.get(href).content
        f.write(resp)
        print(title,"保存成功!")
except OSError:
    pass
# 判断两个队列是否全部清空
if self.page_queue.empty() and self.img_queue.empty():
    break

 

标签:img,get,队列,self,queue,线程,page
From: https://www.cnblogs.com/LoLong/p/16902883.html

相关文章

  • 面试官不按套路,竟然问我Java线程池是怎么统计线程空闲时间?
    背景介绍:你刚从学校毕业后,到新公司实习,试用期又被毕业,然后你又不得不出来面试,好在面试的时候碰到个美女面试官!面试官:小伙子,我看你简历上写的项目中用到了线程池,你知......
  • python单线程爬虫安装与调试
    信息时代的到来,带给我们海量信息的同时也给我们带来很多有用的价值。如何在这些海量信息池里面找到自己需要的有价值的信息就离不开爬虫技术了,那么在python下如果去部署安装......
  • JUC学习笔记——并发工具线程池
    JUC学习笔记——并发工具线程池在本系列内容中我们会对JUC做一个系统的学习,本片将会介绍JUC的并发工具线程池我们会分为以下几部分进行介绍:线程池介绍自定义线程池模......
  • 单线程与多线程的区别及是否有必要多线程的理解
    单线程是一个主线程,执行main方法。多线程是1个主线程,带多个子线程,可以同步进行,也可以异步进行。我个人认为单线程是1种理想的方式,对程序而已。实际上多线程才是真实的线......
  • 线程--thread
    线程:线程是系统分配给内核的最小单元,线程是进程的一部分。特点:1.一个进程可以包含多个线程2.线程也是一个运行行为,消耗计算机资源3.一个进程中的所有线程共享这个进程......
  • chrome 消息队列
    渲染进程微队列(最高优先级),如异步请求交互队列(高优先级),如点击事件延时队列(中优先级),如setTimeout//eg.functiona(){console.log(1);Promise.resolve......
  • LeetCode刷题(8)【栈&队列】用栈实现队列(C语言)
    用栈实现队列232.用栈实现队列-力扣(LeetCode)(leetcode-cn.com)类似题目——用队列实现栈​​LeetCode刷题(7)【栈&队列】用队列实现栈(C语言)_半生瓜のblog-CSDN博客​......
  • 【线性表】之队列(C语言)
    队列​​队列的概念​​​​结构定义​​​​初始化​​​​销毁​​​​队尾入​​​​队头出​​​​队头出​​​​队头数据​​​​队尾数据​​​​是否为空​​​​返......
  • LeetCode刷题(7)【栈&队列】用队列实现栈(C语言)
    用队列实现栈225.用队列实现栈-力扣(LeetCode)(leetcode-cn.com)目的:用队列实现栈,从先进先出——>先进后出,1234这四个数据依次从队列1的队尾进入,要让4先出,一个队列是无法......
  • 《大话数据结构》队列代码汇总
    //队列#include<stdio.h>#include<stdlib.h>#include<time.h>#defineMAXSIZE1000#defineMAX_SIZE20#defineOK1#defineERROR0#defineTRUE1#defineFALSE0//******......