首页 > 编程语言 >python爬虫之aiohttp多任务异步爬虫

python爬虫之aiohttp多任务异步爬虫

时间:2024-06-19 19:32:54浏览次数:29  
标签:__ aiohttp get python app 爬虫 time import

python爬虫之aiohttp多任务异步爬虫

爬取的flash服务如下:

from flask import Flask
import time

app = Flask(__name__)


@app.route('/bobo')
def index_bobo():
    time.sleep(2)
    return 'Hello bobo'

@app.route('/jay')
def index_jay():
    time.sleep(2)
    return 'Hello jay'

@app.route('/tom')
def index_tom():
    time.sleep(2)
    return 'Hello tom'

if __name__ == '__main__':
    app.run(threaded=True)

运行启动flask服务后,多任务爬取代码如下:

#环境安装:pip install aiohttp
#使用该模块中的ClientSession
import requests
import asyncio
import time
import aiohttp

start = time.time()
urls = [
    'http://127.0.0.1:5000/bobo','http://127.0.0.1:5000/jay','http://127.0.0.1:5000/tom'
]

async def get_page(url):
    async with aiohttp.ClientSession() as session:
        #get()、post():
        #headers,params/data,proxy='http://ip:port'
        async with await session.get(url) as response:
            #text()返回字符串形式的响应数据
            #read()返回二进制形式的响应数据
            #json()返回的就是json对象
            #注意:获取响应数据操作之前一定要使用await进行手动挂起
            page_text = await response.text()
            print(page_text)

tasks = []

for url in urls:
    c = get_page(url)
    task = asyncio.ensure_future(c)
    tasks.append(task)

loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.wait(tasks))

end = time.time()

print('总耗时:',end-start)

标签:__,aiohttp,get,python,app,爬虫,time,import
From: https://blog.csdn.net/qq_55829395/article/details/139811195

相关文章

  • Python 迭代器与生成器
    迭代器迭代器(Iterator)是一个可以记住遍历的位置的对象,该对象包含值的可计数数字,在Python当中:迭代器是实现迭代器协议的对象,它包含方法__iter__()和__next__()__iter__()方法作用:返回迭代器对象本身__next__()方法作用:返回迭代器的下一个元素,如果没有元素了则就会触发Sto......
  • 【任务分配】基于粒子群算法多无人机任务分配附python代码
     ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。......
  • Python武器库 - 科研中常用的python图像操作 - 图像显示
    应用场景:在科研中,使用python(opencv)对图像进行操作后,通常需要实时查看操作结果并实施调整,而每次都在文件夹中打开查看是很麻烦的,这就需要我们能够直接通过代码对图像进行可视化展示。这里主要用到cv2中的**imshow(),waitKey()和destroyWindow()/destroyAllWindows()**函数,......
  • Python 遍历文件每一行判断是否只有一个换行符详解
    前言在文件处理过程中,判断文件每一行是否只有一个换行符是一个常见需求。作为测试工程师,我们经常需要对文件的格式进行验证,确保数据的完整性和规范性。本文将详细介绍如何使用Python遍历文件的每一行,并判断每一行是否只有一个换行符。需求分析我们需要编写一个Python程序,......
  • Python 抽奖程序限定次数详解
    前言在开发抽奖程序时,限定用户的抽奖次数是一个常见需求。Python提供了灵活的工具和数据结构,可以轻松实现这个功能。本文将详细介绍如何编写一个限定抽奖次数的Python程序,包括设置抽奖次数限制、记录用户抽奖次数以及实现抽奖逻辑。需求分析我们需要一个抽奖程序,该程序可以......
  • 24年新版!这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
     前⾔微软在UserVoice上运营着⼀个反馈论坛,每个⼈都可以在这⾥提交新点⼦供他⼈投票。票数最⾼的功能请求是“将Python作为Excel的⼀门脚本语⾔”,其得票数差不多是第⼆名的两倍。尽管⾃2015年这个点⼦发布以来并没有什么实质性进展,但在2020年年末,Python之⽗Guidov......
  • python学习3
    所花时间(包括上课): 2h代码量(行): 150左右搏客量(篇): 1了解到的知识点:python备注(其他): 破解百度翻译importrequestsimportjsonif__name__=='__main__':#UA伪装:让爬虫对应的请求载体身份标识伪装成某一款浏览器header......
  • Python最常见的语句、函数,想学好Python必须要懂得!
    1.函数的概念概念写了一段代码实现了某个小功能;然后把这些代码集中到一块,起一个名字,下一次就可以根据这个名字再次使用这个代码,这就是函数。作用方便代码的重复使用。分解任务,简化程序逻辑使代码更加模块化函数分类内建函数三方函数自定义函数2.函数的基本使用简单定......
  • 【Python背记手册】强烈建议!所有Python基础差的同学,死磕这本64页的背记手册!!
    写在前面在数字化飞速发展的今天,掌握一门编程语言成为了许多人的追求。而Python,以其简洁易读、功能强大的特点,成为了编程初学者和资深开发者都青睐的首选。然而,面对众多的学习资源,如何高效、系统地学习Python,成为了许多人面临的难题。今天,我要向大家推荐一本神奇的书籍——《P......
  • 深入理解Python类中的各种方法,非常实用!
    本文将详细介绍Python类中的各种方法,包括实例方法、类方法、静态方法、特殊方法等,并通过示例展示它们的用法和区别。1.实例方法(InstanceMethods)实例方法是最常见的方法,其第一个参数总是self,指向当前实例。实例方法用于操作实例数据和属性。python复制代码classMy......