首页 > 其他分享 >Spider理论系列--协程(一)

Spider理论系列--协程(一)

时间:2023-03-18 22:02:24浏览次数:33  
标签:异步 run -- Spider 线程 IO 协程 asyncio

一、协程

概念

  • 协程
    又称微线程(纤程),是一种用户态的轻量级线程
  • 子程序
    在所有的语言中都是层级调用的,比如A中调用B,B在执行过程中调用C,C执行完返回,B执行完返回,最后是A执行完毕。这是通过栈实现的,一个函数就是一个执行的子程序,子程序的调用总是有一个入口、一次返回,调用的顺序是明确的
  • 理解协程
    普通理解:线程是系统级别的,它们是由操作系统调度。协程是程序级别,由程序员根据需求自己调度。我们把一个线程中的一个个函数称为子程序,那么一个子程序在执行的过程中可以中断去执行别的子程序,这就是协程。也就是说同一个线程下的一段代码1执行执行着就中断,然后去执行另一段代码2,当再次回来执行代码1时,接着从之前的中断的位置继续向下执行
  • 优点
    a、最大的优势就是协程极高的执行效率。因为子程序切换不是线程切换,而是由程序自身控制,因此,没有线程切换的开销,和多线程比,线程数量越多,协程的性能优势就越明显。
    b、不需要多线程的锁机制,因为只有一个线程,也不存在同时写变量冲突,在协程中控制共享资源不加锁,只需要判断状态就好了,所以执行效率比多线程高很多。
  • 缺点
    a、无法利用多核CPU,协程的本质是单个线程,它不能同时将多个CPU的多个核心使用上,失去了标准线程使用多CPU的能力。
    b、进行阻塞操作(操作IO)会阻塞整个程序

二、同步与异步

1、同步与异步的概念

  • 前言
    python由于GIL(全局锁)的存在,不能发挥多核的优势,其性能一直饱受诟病。然而在IO密集型的网络编程里,异步处理比同步处理能提升成百上千倍的效率
    IO密集型就是磁盘的读取数据和输出数据非常大的时候就是属于IO密集型 由于IO操作的运行时间远远大于cpu、内存运行时间,所以任务的大部分时间都是在等待IO操作完成,IO的特点是cpu消耗小,所以,IO任务越多,cpu效率越高,当然不是越多越好,有一个极限值。
  • 同步
    指完成事务的逻辑,先执行第一个事务,如果阻塞了,会一直等待,直到这个事务完成,再执行第二个事务,顺序执行
  • 异步
    是和同步相对的,异步是指在处理调用这个事务的之后,不会等待这个事务的处理结果,直接处理第二个事务去了,通过状态、通知、回调来通知调用者处理结果

2、同步与异步代码

  • 同步
import time

def run(index):
print("lucky is a good man", index)
time.sleep(2)
print("lucky is a nice man", index)

for i in range(1, 5):
run(i)
  • 异步
    说明:后面的课程中会使用到asyncio模块,现在的目的是使同学们理解异步思想
import time
import asyncio

async def run(i):
print("lucky is a good man", i)
# 模拟一个耗时IO
await asyncio.sleep(2)
print("lucky is a nice man", i)

if __name__ == "__main__":
loop = asyncio.get_event_loop()
tasks = []
t1 = time.time()
for url in range(1, 5):
coroutine = run(url)
task = asyncio.ensure_future(coroutine)
tasks.append(task)
loop.run_until_complete(asyncio.wait(tasks))
t2 = time.time()
print("总耗时:%.2f" % (t2 - t1))

三、asyncio模块

1、概述

  • asyncio模块
    是python3.4版本引入的标准库,直接内置了对异步IO的操作
  • 编程模式
    是一个消息循环,我们从asyncio模块中直接获取一个EventLoop的引用,然后把需要执行的协程扔到EventLoop中执行,就实现了异步IO
  • 说明
    到目前为止实现协程的不仅仅只有asyncio,tornado和gevent都实现了类似功能
  • 关键字的说明

关键字

说明

event_loop

消息循环,程序开启一个无限循环,把一些函数注册到事件循环上,当满足事件发生的时候,调用相应的协程函数

coroutine

协程对象,指一个使用async关键字定义的函数,它的调用不会立即执行函数,而是会返回一个协程对象。协程对象需要注册到事件循环,由事件循环调用

task

任务,一个协程对象就是一个原生可以挂起的函数,任务则是对协程进一步封装,其中包含了任务的各种状态

async/await

python3.5用于定义协程的关键字,async定义一个协程,await用于挂起阻塞的异步调用接口

2、asyncio基本使用

  • 定义一个协程
import asyncio
import time

# 通过async关键字定义了一个协程,协程是不能直接运行的,需要将协程放到消息循环中
async def run(x):
print("waiting:%d"%x)
await asyncio.sleep(x)
print("结束run")

#得到一个协程对象
coroutine = run(2)
asyncio.run(coroutine)
  • 等同于
import asyncio
import time

# 通过async关键字定义了一个协程,协程是不能直接运行的,需要将协程放到消息循环中
async def run(x):
print("waiting:%d"%x)
await asyncio.sleep(x)
print("结束run")

#得到一个协程对象
coroutine = run(2)


标签:异步,run,--,Spider,线程,IO,协程,asyncio
From: https://blog.51cto.com/u_15915681/6129817

相关文章

  • 一般人我都不告诉他的那些css伪选择器
    什么是伪选择器CSS中的伪选择器是指用于匹配特定状态或位置的选择器,它们不是基于HTML元素的实际属性进行匹配,而是基于元素的状态或上下文进行匹配。常用的伪选择前端......
  • JavaScript 数据类型详解
    原文链接:​   ​​https://note.noxussj.top/?source=51cto​​常见的ES5数据类型分为基本数据类型、引用数据类型两种。包含字符串、数字、对象、数组、函数、布尔值......
  • #yyds干货盘点#对于babel的一些理解
    Babel是一个JavaScript编译器Babel是一个工具链,主要用于将采用ECMAScript2015+语法编写的代码转换为向后兼容的JavaScript语法,以便能够运行在当前和旧版本的浏览器......
  • msvcr120.dll丢失是什么意思?msvcr120.dll文件丢失修复方法
    msvcr120.dll是干嘛的?msvcr120.dll是vs2010编译的程序默认的库文件它的丢失易导致游戏、应用软件等程序运行出现错误,致使程序无法正常运行,今天小编把自测解决缺少msvcr120.d......
  • 爬虫urllib库(上)
    Urllib1.什么是互联网爬虫?如果我们把互联网比作一张大的蜘蛛网,那一台计算机上的数据便是蜘蛛网上的一个猎物,而爬虫程序就是一只小蜘蛛,沿着蜘蛛网抓取自己想要的数据。2......
  • Quick start | Libevent
    1.下载libevent源码$gitclonehttps://github.com/libevent/libevent.git2.创建本地安装目录并添加本地bin目录到环境变量PATH$exportMY_INSTALL_DIR=$HOME/.......
  • Swift 关键字总结(二)--Mutating
    Swift语言中结构体和枚举是值类型。一般情况下,值类型的属性不能在它的实例方法中被修改。但是,如果你确实需要在某个具体的方法中修改结构体或者枚举的属性,你可以选择变......
  • docker镜像转存脚本
    #需要有外网服务器!!!#!/bin/bashecho-e"\E[0;41m私有仓库需要提前登录!!\E[0m\n"checkEv(){if[$1==0];thenecho-e"\E[0;42mok!!!!\E[0m\n"else......
  • pta python实验1-3
    7-1HelloWorld这是学习每种程序设计语言的第一个实例。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬输出Hell......
  • Kubernetes学习之基础知识
    Kubernetes是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。它提供了许多功能,例如服务发现、负载均衡、自动伸缩、滚动更新等,使得运维人员可以轻松地......