首页 > 其他分享 >Scrapy Logging日志

Scrapy Logging日志

时间:2023-11-03 16:31:30浏览次数:33  
标签:严重性 logging LOG scrapy Scrapy Logging myspiders 日志

日志级别

Python 的内置日志记录定义了 5 个不同的级别来指示给定日志消息的严重性

logging.CRITICAL 用于严重错误(最高严重性)

logging.ERROR 常规错误

logging.WARNING 用于警告消息

logging.INFO 用于信息性消息

logging.DEBUG 用于调试消息(最低严重性)

创建项目

创建项目
scrapy startproject myspider

进入项目目录
cd myspider

创建爬虫
scrapy genspider myspiders https://scrapinghub.com

运行爬虫
scrapy crawl myspiders

编写脚本

myspiders.py

import scrapy


class MyspidersSpider(scrapy.Spider):
    name = "myspiders"
    start_urls = ["https://scrapinghub.com"]

    def parse(self, response, **kwargs):
        self.logger.info('Parse function called on %s', response.url)

settings.py

Scrapy中可以在settings.py中配置日志信息将日志保存的指定位置,设置后在终端不会显示日志内容

LOG_STDOUT = False
LOG_LEVEL = "INFO"
LOG_FILE = "./my_spider.log"

验证结果

Scrapy Logging日志_ide

标签:严重性,logging,LOG,scrapy,Scrapy,Logging,myspiders,日志
From: https://blog.51cto.com/Ac1998/8172789

相关文章

  • 如何为Windows服务增加Log4net和EventLog的日志功能
    一、简介最近在做一个项目的时候,需要该项目自动启动、自动运行,不需要认为干预。不用说,大家都知道用什么技术,那就是Windows服务。在以前的NetFramework平台下,Windows服务是一个不错的选择。如果现在在NetCore版本,或者Net5.0以及以上版本,我们会有另外一个选择,这就是......
  • 归档日志碎片化
    概念描述oracle数据库根据每16个CPU分一股strand,每一股独立从log_buffer和redologfile中分配一块空间,当其中一股log_buffer空间写满,会要求继续从redologfile中分配一个空间,如果没有剩余空间可以用,则redo会发生切换。所以log_buffer设置不当也会是引起日志切换过快,并且归档日志碎......
  • VS2015 日志
    VA选项颜色与属性 “以斜体显示系统符号”高亮 引用和光标下所有语言-常规-自动大括号完成(&B)取消停靠窗口时崩溃devenv.exe主进程的同目录下的devenv.exe.config文件修改,需改节点AppContextSwitchOverrides添加值;Switch.System.Windows.Interop.MouseInput.O......
  • 日志数据如何同步到MaxCompute
    https://developer.aliyun.com/article/727331摘要:日常工作中,企业需要将通过ECS、容器、移动端、开源软件、网站服务、JS等接入的实时日志数据进行应用开发。包括对日志实时查询与分析、采集与消费、数据清洗与流计算、数据仓库对接等场景。本次分享主要介绍日志数据如何同步到M......
  • 大学生创新训练项目开发日志 (10-26 ~ 11-2)
    进展资源钩取我们通过如下方法对资源钩取模块进行了改进:对getDrawable()返回的Drawable实例进行了进一步处理,降低被丢弃的资源的比率。通过LayoutInflater.inflate()返回的ImageView实例的getDrawable()方法获取该实例内含的Drawable资源。进行了如下改进后,对......
  • sql server 截断和收缩所有用户数据库日志--用游标循环所有正常状态的用户数据库
    在服务器运维活动中,我们经常需要做一项工具就是将好多年的用户数据库日志文件截断并收缩为最小,以节省大量的磁盘空间。当数据库只有一两个时可以手动操作,但数据库数量众多时,就需要采用sql脚本,批量化执行这个过程。本人写了一段这样的脚本。并且经过验证执行无误。现在分享出来,您......
  • 【python爬虫】80页md笔记,0基础到scrapy项目高手,第(3)篇,requests网络请求模块详解
    本文主要学习一下关于爬虫的相关前置知识和一些理论性的知识,通过本文我们能够知道什么是爬虫,都有那些分类,爬虫能干什么等,同时还会站在爬虫的角度复习一下http协议。完整版笔记直接地址:请移步这里共8章,37子模块,总计56668字requests模块本阶段本文主要学习requests这......
  • 2023.11 模拟赛日志
    目录SS231101(20231101)标记*是将要写或研究的题目,%就是摆烂,ok的话也许是想到了不想写的意思,没有其他标记就是过了;一个中括号括起来的题目名称就是没写题解,反之是有题解。SS231101(20231101)陈浩霆round。[A动态规划]神秘跳棋题(A014225)[B线段树]简单动态min(维护\(x,......
  • Allure企业级报告定制化自定义logo,中文标题,模块名,用例名,用例详细的测试数据如用例日志
    【自定义logo】进入Allure的安装路径,找到config目录。在config目录下,找到allure.yml文件,并打开该文件。在allure.yml文件中,添加custom-logo-plugin选项。进入Allure的安装路径,找到plugins目录下的custom-logo-plugin目录。在custom-logo-plugin目录下,找到static目录,并将自己需要展......
  • docker收集日志到es并展示
    1、安装es注意:关闭xpack.security.enabled:false权限认证允许跨域http.cors.enabled:truehttp.cors.allow-origin:"*https://blog.csdn.net/qq_40739917/article/details/131654563dockerrun--nameelasticsearch-p9200:9200-p9300:9300-e......