信号量的秘密：Python中的Semaphore详解

标签：访问 Python Semaphore 信号量 threading 线程 url semaphore

引言

随着计算机硬件的发展，多核处理器已经成为了标准配置。这使得开发人员可以利用并发编程技术来提高应用程序的性能。然而，在并发环境下，资源共享和访问控制成了一个棘手的问题。Semaphore（信号量）就是一种常用的解决此类问题的技术。通过限制对共享资源的同时访问数量，Semaphore可以有效地防止资源的竞争条件，保证程序的正确性。

Semaphore主要有两种类型：二进制信号量和计数信号量。前者只能在0和1之间切换，通常用于互斥锁；后者则可以有任意非负整数值，用于控制同时访问某个资源的线程数量。

接下来，我们将详细介绍Semaphore的基础知识，并通过一些实用的例子来展示其在实际开发中的应用。

基础语法介绍

在Python中，Semaphore可以通过threading模块获取。下面是一个简单的Semaphore对象创建示例：

import threading

# 创建一个初始值为5的Semaphore对象
semaphore = threading.Semaphore(5)

Semaphore的主要方法包括：

acquire([blocking[, timeout]])：尝试获取一个许可。如果blocking为True且Semaphore当前没有可用许可，则会阻塞直到获得许可或超时。
release()：释放一个之前获取的许可。如果当前Semaphore的值已经达到最大值，则该操作无效。

基础实例

假设我们有一个网站，同时只能允许5个用户访问。我们可以使用Semaphore来模拟这个场景：

import threading
import time

# 创建一个初始值为5的Semaphore对象
semaphore = threading.Semaphore(5)

def access_website():
    # 尝试获取一个许可
    semaphore.acquire()
    
    print(f"{threading.current_thread().name} 正在访问网站")
    time.sleep(2)  # 模拟访问时间
    
    print(f"{threading.current_thread().name} 已完成访问")
    # 释放许可
    semaphore.release()

# 创建多个线程模拟用户访问
threads = []
for i in range(10):
    t = threading.Thread(target=access_website)
    threads.append(t)
    t.start()

# 等待所有线程执行完毕
for t in threads:
    t.join()

在这个例子中，我们定义了一个access_website函数来模拟用户访问网站的行为。通过Semaphore的acquire和release方法，我们成功地限制了同时访问的数量。

进阶实例

在更复杂的场景下，我们可能需要处理多个不同类型的资源访问限制。这时候，我们可以为每种资源创建一个独立的Semaphore对象，从而实现更加灵活的控制。

例如，假设我们的网站除了普通用户访问外，还有管理员登录的功能。我们可以分别为这两种操作设置不同的访问限制：

import threading
import time

# 创建两个Semaphore对象，分别用于限制普通用户访问和管理员登录
user_semaphore = threading.Semaphore(5)
admin_semaphore = threading.Semaphore(2)

def user_access():
    user_semaphore.acquire()
    print(f"{threading.current_thread().name} 用户正在访问")
    time.sleep(2)
    print(f"{threading.current_thread().name} 用户访问结束")
    user_semaphore.release()

def admin_login():
    admin_semaphore.acquire()
    print(f"{threading.current_thread().name} 管理员正在登录")
    time.sleep(3)
    print(f"{threading.current_thread().name} 管理员登录结束")
    admin_semaphore.release()

# 创建多个线程模拟用户访问和管理员登录
threads = []
for i in range(7):
    if i % 2 == 0:
        t = threading.Thread(target=user_access, name=f"User {i}")
    else:
        t = threading.Thread(target=admin_login, name=f"Admin {i}")
    threads.append(t)
    t.start()

# 等待所有线程执行完毕
for t in threads:
    t.join()

实战案例

在真实的项目中，Semaphore的应用更为广泛。比如，在爬虫程序中，我们经常需要限制同时发起的请求数量，以避免给服务器带来过大压力。下面是一个使用Semaphore进行请求限流的例子：

import requests
import threading
from queue import Queue

# 创建一个初始值为5的Semaphore对象
semaphore = threading.Semaphore(5)

def fetch_url(url):
    semaphore.acquire()
    try:
        response = requests.get(url)
        print(f"访问 {url}: {response.status_code}")
    finally:
        semaphore.release()

# 初始化任务队列
urls = [
    "https://www.example.com",
    "https://www.google.com",
    "https://www.github.com",
    "https://www.python.org",
    "https://www.apache.org",
    "https://www.cnblogs.com",
    "https://www.baidu.com",
    "https://www.zhihu.com"
]
queue = Queue()
for url in urls:
    queue.put(url)

# 创建工作线程
def worker():
    while not queue.empty():
        url = queue.get()
        fetch_url(url)
        queue.task_done()

threads = []
for _ in range(8):
    t = threading.Thread(target=worker)
    threads.append(t)
    t.start()

# 等待所有线程执行完毕
for t in threads:
    t.join()

在这个例子中，我们首先定义了一个fetch_url函数来模拟网络请求。通过Semaphore的acquire和release方法，我们成功地限制了同时发起的请求数量。此外，我们还使用了queue.Queue来管理待处理的任务列表，进一步提高了代码的可读性和可维护性。

扩展讨论

Semaphore虽然功能强大，但在使用过程中也存在一些需要注意的地方。例如，当一个线程调用release()方法时，如果没有其他线程等待该Semaphore，则该操作不会立即唤醒任何线程。此外，Semaphore并不提供公平性保证，即先等待的线程不一定能先获取许可。

对于更高级的需求，如优先级调度、定时许可等，Python提供了threading.Event和threading.Condition等更强大的工具。了解这些工具的工作原理及其之间的区别，将有助于我们编写出更加高效、健壮的并发程序。

总之，Semaphore作为一种经典的同步原语，在并发编程中扮演着重要角色。通过本文的学习，希望你已经掌握了Semaphore的基本用法，并能够在自己的项目中灵活运用。当然，真正的精通还需要不断地实践与探索。希望你能在这个过程中发现更多乐趣！

标签：访问,Python,Semaphore,信号量,threading,线程,url,semaphore
From： https://blog.csdn.net/qq_44771627/article/details/142612933