首页 > 系统相关 >进程间通信(队列和生产消费模型)

进程间通信(队列和生产消费模型)

时间:2024-01-25 14:59:14浏览次数:38  
标签:queue obj get 队列 模型 间通信 print 进程

(一)引入

(1)什么是进程间的通信 IPC

  • 进程间通信(Inter-Process Communication, IPC)是指两个或多个进程之间进行信息交换的过程
  • 它是一种计算机编程技术,用于在不同的进程之间共享数据和资源

(2)如何实现进程间通信

  • 借助于消息队列,进程可以将消息放入队列中,然后由另一个进程从队列中取出
  • 这种通信方式是非阻塞的,即发送进程不需要等待接收进程的响应即可继续执行
  • multiprocessing模块支持两种形式:队列和管道,这两种方式都是使用消息传递的

(3)什么是管道

  • 管道是一种半双工的通信机制,即只能在一个方向上进行数据传输。
  • 子进程可以通过继承父进程的管道来实现通信。
  • stdin、stdout和stderr是Python中的三个内置文件对象,它们分别代表标准输入、标准输出和标准错误。
  • 这些对象也可以作为管道使用。
  • 当我们在一个进程中使用read方法读取管道内的消息后,其他进程将无法再获取该管道内的任何其他消息。
  • 因此,我们需要使用锁或其他同步机制来确保多个进程能够正确地访问和修改共享资源。

(4)什么是队列(管道+锁)

  • 队列是一种线程安全的数据结构,它支持在多线程环境中高效的实现生产者-消费者模型
  • 队列的特性是先进先出,即先插入队列的数据将先被取出
  • 堆栈式一种先进后出的数据结构,与队列相反,最后插入的数据将首先被取出

(5)进程间通信的目的

  • 存是为了更方便的取
  • 千方百计的存
  • 简单快捷的取

(二)队列介绍

(1)创建队列的类

  • 底层就是以管道和锁定的方式实现

(1)语法

# 导入模块
import queue
q=queue.Queue()
  • 创建共享的进程队列
  • Queue是多进程安全的队列
  • 可以使用Queue实现多进程之间的数据传递

(2)参数

  • Queue(maxsize)
  • maxsize 是队列中允许存在的最大项数,可以指定项数,省略则表示无大小限制

(2)方法介绍

(1)主要方法

  • q.put() 插入数据到队列中
    • 用以插入数据到队列中,put方法还有两个可选参数:blocked和timeout。
    • 如果blocked为True(默认值),并且timeout为正值,该方法会阻塞timeout指定的时间,直到该队列有剩余的空间。如果超时,会抛出Queue.Full异常
    • 如果blocked为False,但该Queue已满,会立即抛出Queue.Full异常。
  • q.get() 获取队列中的数据并将数据从队列中删除
    • 可以从队列读取并且删除一个元素,同样,get方法有两个可选参数:blocked和timeout。
    • 如果blocked为True(默认值),并且timeout为正值,那么在等待时间内没有取到任何元素,会抛出Queue.Empty异常。
    • 如果blocked为False,有两种情况存在,如果Queue有一个值可用,则立即返回该值,否则,如果队列为空,则立即抛出Queue.Empty异常.
  • q.get_nowait()
    • 同q.get(False)
  • q.put_nowait()
    • 同g.put(False)
  • q.empty() 判断队列是否为空
    • 调用此方法时q为空则返回True,该结果不可靠,比如在返回True的过程中,如果队列中又加入了项目。
  • q.full() 判断队列是否已满
    • 调用此方法时q已满则返回True,该结果不可靠,比如在返回True的过程中,如果队列中的项目被取走。
    • q.qsize() 返回队列中目前项目的正确数量
      • 返回队列中目前项目的正确数量,结果也不可靠,理由同q.empty()和q.full()一样

(2)了解方法

  • q.cancel_join_thread()
    • 不会在进程退出时自动连接后台线程。可以防止join_thread()方法阻塞
  • q.close()
    • 关闭队列,防止队列中加入更多数据。
    • 调用此方法,后台线程将继续写入那些已经入队列但尚未写入的数据,但将在此方法完成时马上关闭。
    • 如果q被垃圾收集,将调用此方法。
    • 关闭队列不会在队列使用者中产生任何类型的数据结束信号或异常。
    • 例如,如果某个使用者正在被阻塞在get()操作上,关闭生产者中的队列不会导致get()方法返回错误。
  • q.join_thread()
    • 连接队列的后台线程。
    • 此方法用于在调用q.close()方法之后,等待所有队列项被消耗。
    • 默认情况下,此方法由不是q的原始创建者的所有进程调用。调用q.cancel_join_thread方法可以禁止这种行为

(3)方法示例

(1)q.get()

# 导入模块
import queue
# 创建队列对象
q=queue.Queue()

# 向队列中加入数据
q.put(1)

# 取出队列中的数据
print(q.get())# 1

# 如果队列中无数据 不会报错但会卡住
print(q.get())

"""
	当队列中的数据已经满了之后,还要放入数据那么程序就会阻塞,指定队列中有位置让出来(不会报错)
	当队列中的数据已经全部取出后,仍要取出数据 程序也会阻塞
"""

(2)q.get_nowait() : 队列无数据时会报错

# 导入模块
import queue
# 创建队列对象
q=queue.Queue()

# 向队列中加入数据
q.put(1)

# 取出队列中的数据
print(q.get())# 1

# 如果队列中无数据 不会报错但会卡住
# print(q.get())

# 当队列中的数据已被取空后 q.get_nowait()会报错
print(q.get_nowait())# _queue.Empty

(3)q.get(timeout=3):设置延迟时间,推迟指定时间后报错

# 导入模块
import queue

# 创建队列对象
q=queue.Queue()

# 向队列中放入数据
q.put(1)
q.put(2)
# 取出队列中的数据
print(q.get())
print(q.get(timeout=3))

# 设置延时时间,推迟指定 s 数  报错
print(q.get(timeout=3))
#     raise Empty _queue.Empty

(4)q.full() :判断队列是否已经填满

# 导入模块
import queue
# 创建队列对象
q=queue.Queue(3)
q.put(1)
q.put(2)
# 创建队列对象,设置队列中最多有三个元素,放入两个时,判断队列是否已经填满了
print(q.full())# False
q.put(3)
# 设置队列中最多有三个元素,向队列中放入三个元素后,判断队列是否已经填满了
print(q.full())# True

(5)q.empty():判断当前队列是否为空

# 导入模块
import queue

# 创建队列对象
q=queue.Queue(3)
# 此时不向队列中,添加任何元素时,判断当前队列是否为空
print(q.empty())# True
# 向队列中放入元素,判断队列是否为空
q.put(1)
print(q.empty())# False

(4)队列queue模块小结

"""queue模块"""

# 导入模块
import queue

# 创建队列对象
# q=queue.Queue(maxsize=5)
# 可以指定参数,指定的参数指的时队列中的元素的个数,
# 也可以不设置参数,那么元素的个数可以是随意的
q=queue.Queue(maxsize=5)

# q.put()方法  向队列中添加元素
q.put(1)
q.put(2)

# q.get()方法,取出队列中的元素
print(q.get()) # 1
print(q.get()) # 2
# 如果想要取得元素个数 大于队列中得元素个数 q.get()方法会发送阻塞,但不会报错
# print(q.get())

# q.get_nowait()方法
# 当队列中没有元素数据了,q.get_nowait()方法,不会发送阻塞,会报错
q.get_nowait()
#     raise Empty
# _queue.Empty

# q.full()方法:判断队列是否已经填满
# 满了就返回True,没有满就返回False
q.full()

# q.empty()方法:判断队列是否为空
# 空了就返回True,没空就返回False
q.empty()
  • 以上方法在多进程 的情况下不精确
  • 多进程的队列切换时间是非常短的,存在可能判断失误

(三)进程间通信(IPC机制)

(1)什么是IPC机制

  • IPC机制指进程间通信机制(Inter-Process Communication),它是指在不同进程间传输数据或者信息的一种机制。
  • 在多进程操作系统中,各个进程相互独立,不能直接访问对方的内存空间,所以必须通过特殊的通信方式实现进程之间的信息交换和协调。
  • 常见的IPC机制包括管道、消息队列、共享内存和信号量等方式。
  • 其中,管道、消息队列和共享内存都是用于进程之间的数据传输
  • 而信号量则是用于进程之间的同步与互斥。
  • 通过使用IPC机制,可以使得不同进程能够有效地协同工作,在复杂的程序设计中起到十分重要的作用。

(2)子进程与主进程之间通过队列进行通信

  • 主进程与子进程之前借助于队列进行通信
"""主进程与子进程间的通信"""
# 子进程向队列中填入数据,主进程获取出队列着数据
import time
# 导入模块
from multiprocessing import Process,Queue
def test(q):
    print(f"子进程")
    q.put(11)
    time.sleep(2)
if __name__ == '__main__':
    print("主进程开始")
    # 创建队列对象
    q=Queue()
    # 创建进程对象
    p=Process(target=test,args=(q,))
    p.start()
    p.join()
    print(q.get())
    print("主进程结束")
    
    
# 主进程向队列中添加数据,子进程获取出队列中的数据
"""主进程添加数据,子进程获取数据"""
# 导入模块
from multiprocessing import Process,Queue

def test(q):
    msg=q.get()
    print(f"这是子进程获取到的列表元素{msg}")

def main():
    print("主进程开始")
    # 创建队列对象
    q=Queue()
    # 主进程向列表中添加元素
    q.put("主进程添加进入的")
    # 创建进程对象
    p=Process(target=test,args=(q,))
    # 启动进程对象
    p.start()
    p.join()
    print("主进程结束")
if __name__ == '__main__':
    main()

(3)子进程与子进程之间借助队列进行通信

  • 子进程与子进程之间借助队列进行通信
"""子进程与子进程之间借助队列进行通信"""
# 导入模块
from multiprocessing import Process,Queue

# 向队列中添加元素
def test1(q):
    q.put(1)
    print("子进程向队列中添加元素成功!!")

# 获取出队列中的元素
def test2(q):
    msg=q.get()
    print(f"子进程获取出队列中的元素{msg}!!")

def main():
    # 创建队列对象
    q=Queue()
    # 创建进程对象
    p1=Process(target=test1,args=(q,))
    p2=Process(target=test2,args=(q,))
    p1.start()
    p2.start()

if __name__ == '__main__':
    main()
# 子进程向队列中添加元素成功!!
# 子进程获取出队列中的元素1!!




"""子进程与子进程之间借助队列进行通信"""

# 导入模块
from multiprocessing import  Process,Queue
# 创建一个子进程函数
def producer(queue_obj):
    # 生产者进程向队列中添加数据
    queue_obj.put(1111)
    print("生产者进程已添加数据!!!")
# 再创建一个子进程函数
def customer(queue_obj):
    # 消费者对象获取出队列的数据
    msg=queue_obj.get()
    print(f"消费者进程获取出队列中的{msg}数据")
# 创建一个主函数
def main():
    # 创建队列对象
    queue_obj=Queue()
    # 创建进程对象
    p1=Process(target=producer,args=(queue_obj,))
    p2=Process(target=customer,args=(queue_obj,))
    p1.start()
    p2.start()
    p1.join()
    p2.join()

if __name__ == '__main__':
    main()

# 生产者进程已添加数据!!!
# 消费者进程获取出队列中的1111数据

(四)生产者和消费者模型

(1)理论

(1)生产者模型

  • 生产者模型和消费者模型是指通过利用队列解耦生产者和消费者的一种并发编程模型。
  • 在生产者模型中,生产者负责将数据放入共享队列中,而消费者则从队列中取出数据进行处理。
  • 生产者和消费者之间通过共享这个队列来进行信息的交流。
  • 这种模型适用于生产者和消费者之间的处理速度不一致的情况,同时还能够保证数据传输的安全性和正确性。

(2)消费者模型

  • 在消费者模型中,消费者负责向队列中插入任务,而由线程池中的工作线程进行任务的处理。
  • 消费者和工作线程之间通过共享线程池中的任务队列来完成任务分发和执行。
  • 这种模型适用于任务处理需要一定时间的情况,能够充分利用多线程的优势提高系统的并发性能,提高效率。

(3)小结

  • 生产者:生产/制造东西
  • 消费者:消费/处理东西
  • 该模型还需要一个媒介

(2)实现

  • 消费者大于生产者

  • 在消费者获取初数据前判断队列李是否为空

  • 不为空 取出数据

  • 为空 结束消费

# 导入模块
from multiprocessing import Process,Queue
import time

# 创建生产者函数
def producer(queue_obj):
    # 生产者---向列表中添加数据
    for i in range(1,3):
        queue_obj.put(i)
        # time.sleep(2)
    # 添加标志位
    # queue_obj.put('q')

# 创建消费者函数
def customer(queue_obj):
    while True:
        if  not queue_obj.empty():
            msg=queue_obj.get()
            # if msg=='q':
            #     print("消费者消费完毕!!")
            #     break
            print(f"消费者取出队列中的数据---{msg}")
        else:
            break
# 创建主函数
def main():
    print("主进程开始")
    # 创建队列对象
    queue_obj=Queue()
    # 创建一个空的进程列表
    p_list=[]
    # 创建生产者对象
    p1=Process(target=producer,args=(queue_obj,))
    p2=Process(target=producer,args=(queue_obj,))

    # 创建消费者对象
    c1=Process(target=customer,args=(queue_obj,))
    c2=Process(target=customer,args=(queue_obj,))
    # 启动进程对象
    p1.start()
    p2.start()
    c1.start()
    c2.start()
    p_list.append(p1)
    p_list.append(p2)
    p_list.append(c1)
    p_list.append(c2)
    for task in p_list:
        task.join()
    print("主进程结束")
if __name__ == '__main__':
    main()


# 主进程开始
# 消费者取出队列中的数据---1
# 消费者取出队列中的数据---2
# 消费者取出队列中的数据---1
# 消费者取出队列中的数据---2
# 主进程结束
  • 给生产者加一个标准位
  • 消费者获取出队列中的标准位时
  • 结束消费
# 导入模块
from multiprocessing import Process,Queue
import time

# 创建生产者函数
def producer(queue_obj):
    # 生产者---向列表中添加数据
    for i in range(1,3):
        queue_obj.put(i)
        # time.sleep(2)
    # 添加标志位
    queue_obj.put('q')

# 创建消费者函数
def customer(queue_obj):
    while True:
        msg=queue_obj.get()
        if msg=='q':
            print("消费者消费完毕!!")
            break
        print(f"消费者取出队列中的数据---{msg}")

# 创建主函数
def main():
    print("主进程开始")
    # 创建队列对象
    queue_obj=Queue()
    # 创建一个空的进程列表
    p_list=[]
    # 创建生产者对象
    p1=Process(target=producer,args=(queue_obj,))
    p2=Process(target=producer,args=(queue_obj,))

    # 创建消费者对象
    c1=Process(target=customer,args=(queue_obj,))
    c2=Process(target=customer,args=(queue_obj,))
    # 启动进程对象
    p1.start()
    p2.start()
    c1.start()
    c2.start()
    p_list.append(p1)
    p_list.append(p2)
    p_list.append(c1)
    p_list.append(c2)
    for task in p_list:
        task.join()
    print("主进程结束")
if __name__ == '__main__':
    main()
  • JoinableQueue模块
  • 每当向队列对象中存入数据的时候,队列对象内部会有一个计数器+1
  • 每当调用异常task——done()方法的时候,队列对象内部的计数器-1
  • join()当计数器为0时,继续执行代码
# 导入模块
from multiprocessing import Process,Queue,JoinableQueue
import time
# 生产者
def producer(queue_obj):
    for i in range(1,5):
        queue_obj.put(i)
    queue_obj.join()
# 消费者
def customer(queue_obj):
    while True:
        msg=queue_obj.get()
        print(f"消费者取出队列中的数据{msg}")
        # queue_obj.task_done() 会自动检索队列中的数据个数,如果数据大于1就忽略,如果数据等于0就自动结束
        queue_obj.task_done()
# 主进程
def main():
    # 创建队列对象
    queue_obj=JoinableQueue()
    # 创建空的进程列表
    task_list=[]

    # 创建进程对象
    # 生产者对象
    p1=Process(target=producer,args=(queue_obj,))
    p2=Process(target=producer,args=(queue_obj,))
    # 消费者对象
    c1 = Process(target=customer, args=(queue_obj,))
    c2 = Process(target=customer, args=(queue_obj,))
    # 把消费者设置为守护进程
    # 随着主进程的结束而结束
    c1.daemon=True
    c2.daemon=True
    
    task_list.append(p1)
    task_list.append(p2)
    task_list.append(c1)
    task_list.append(c2)
    for task in task_list:
        task.start()
    # 主进程等待 生产者
    p1.join()
    p2.join()
    print("主进程结束")
if __name__ == '__main__':
    main()

# 消费者取出队列中的数据1
# 消费者取出队列中的数据2
# 消费者取出队列中的数据3
# 消费者取出队列中的数据4
# 消费者取出队列中的数据1
# 消费者取出队列中的数据2
# 消费者取出队列中的数据3
# 消费者取出队列中的数据4
# 主进程结束
生产者和消费者模型小结:
  • 生产者和消费者模型总结:
    • 生产者:生产数据 生产完所有数据以后要加一个标志位
    • 消费者:消费数据 从生产者生产的数据中拿出所有数据
  • 解决生产者和消费者不平稳 一:
    • Queue
      • 在生产者生产数据的末尾加一个标志位
      • 消费者消费数据,消费者消费到最后一个数据得到生产者加入的标准位时,结束
  • 解决生产者和消费者不平稳 二:
    • JoinableQueue:
      • 在生产者生产数据的时候放一个标志位---队列对象.join()
      • 在消费者消费数据的时候---正常消费---在消费数据的结尾加入 队列对象.task_done() ---自动检索生产者是否存在join()
      • 自动检索队列中的数据个数---大于1继续继续,等于0结束

(五)JoinableQueue模块

(1)介绍

  • JoinableQueue 模块:这就像时一个Queue对象,但队列允许项目的使用者通知生产者项目已经被成功处理
  • 通知进程时使用共享的信号和条件变量来实现的

(2)使用

  • JoinableQueue([maxsize])
    • maxsize是队列中允许最大项数,省略则无大小限制。
from multiprocessing import JoinableQueue
    
q = JoinableQueue()

# 方法介绍:JoinableQueue的实例p除了与Queue对象相同的方法之外还具有:

# q.task_done():使用者使用此方法发出信号,表示q.get()的返回项目已经被处理。如果调用此方法的次数大于从队列中删除项目的数量,将引发ValueError异常

# q.join():生产者调用此方法进行阻塞,直到队列中所有的项目均被处理。阻塞将持续到队列中的每个项目均调用q.task_done()方法为止

标签:queue,obj,get,队列,模型,间通信,print,进程
From: https://www.cnblogs.com/suyihang/p/17987124

相关文章

  • IO模型
    (一)IO模型简介目前我们眼睛的IO都是基于网络IO的Stevens在文章中一共比较了五种IOModel:blockingIO阻塞IO模型nonblockingIO非阻塞IO模型IOmultiplexingIO多路复用模型signaldrivenIO---(忽略)asynchronousIO异步IO模型由signaldrivenIO(信号驱动IO)在实......
  • 双端队列(deque)--python
    Python中的双端队列(deque)是一种特殊的数据结构,它允许在队列的两端进行插入和删除操作12。双端队列可以看成栈和队列的结合3。在Python中,我们可以使用collections模块中的deque类来创建双端队列12。下面是一些常用的操作方法1:Python`fromcollectionsimportdeque`#创建一个......
  • 基于Redis的Stream类型的完美消息队列解决方案(全)
    1概述2追加新消息,XADD,生产消息3从消息队列中获取消息,XREAD,消费消息4消息ID说明5消费者组模式,consumergroup6Pending等待列表7消息转移8坏消息问题,DeadLetter,死信问题9信息监控,XINFO10命令一览11Stream数据结构,RadixTree,基数树12相关产品1概述Redis5.......
  • 使用CPU运行大语言模型(LLM),以清华开源大模型ChatGLM3为例:无需显卡!用CPU搞定大模型运行
    教程视频地址:无需显卡!用CPU搞定大模型运行部署!【详细手把手演示】按照上面视频进行安装配置之前需要注意,python编程环境需要大于等于python3.10,否则会运行报错。下载好GitHub上的项目代码后需要运行pipinstall-rrequirements.txt配置好后运行效果:相关资料:【ChatGL......
  • PYTHON 用几何布朗运动模型和蒙特卡罗MONTE CARLO随机过程模拟股票价格可视化分析耐克
    原文链接:http://tecdat.cn/?p=27099最近我们被客户要求撰写关于蒙特卡罗的研究报告,包括一些图形和统计输出。金融资产/证券已使用多种技术进行建模。该项目的主要目标是使用几何布朗运动模型和蒙特卡罗模拟来模拟股票价格。该模型基于受乘性噪声影响的随机(与确定性相反)变量该项......
  • 优先队列
    数学数学-组合数学数学-数论数学-博弈论数学-线性代数数学-概率期望动态规划动态规划-优化动态规划-背包进阶动态规划-计数dp动态规划-图上dp数据结构数据结构-线段树进阶数据结构-平衡树数据结构-Trie数据结构-分块数据结构-莫队数据结构-点分治数据结构-......
  • 中国大模型迎来“95后” 百度奖学金发掘百位“未来AI技术领袖”
    在人工智能掀起的科技革命和产业变革浪潮下,大模型成为最受关注的研究领域。1月22日,第十一届百度奖学金颁奖典礼在北京举行,来自全球顶尖高校及科研机构的10位“未来AI技术领袖”脱颖而出,他们平均年龄仅27岁,其中8人聚焦大模型领域。百度首席技术官王海峰致辞并颁奖。百度首席技术......
  • 读论文-基于注意力机制的浅层图像隐写分析模型
    前言今天要读的论文是一篇名为《基于注意力机制的浅层图像隐写分析模型》,文章提出了一种基于注意力机制的浅层图像隐写分析模型,通过使用一个浅层神经网络控制模型参数量和训练时间,引入注意力模块,加速模型收敛,提升模型检测的准确率。要引用本文:请使用如下格式:段明月,李爽,钟小......
  • 什么是大模型?一文读懂大模型的基本概念
    大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的基本概念出发,对大模型领域容易混淆的相关概念进行区分,并就大模型的发展历程、特点和分类、泛化与微调进行了详细解读,供大家在了解大模型基本知识的过程中起到一定参考作用。本文目录如下:·大模型的定义......
  • 如何训练一个“万亿大模型”?
    1.背景近几年,随着“大模型”概念的提出,深度学习模型越来越大,如何训练这些大模型成为一个亟待解决的工程问题。最初的视觉模型只有几百兆的参数量,而现在的语言模型中,动则百亿,千亿的参数量,甚至万亿的大模型也是见怪不怪。如此巨大的参数量将会消耗巨大的存储空间。如下表所示为......