高级方法:
一般方法:
运行爬虫时使用-a传递参数
scrapy crawl 爬虫名 -a key=values
然后在爬虫类的__init__魔法方法中获取kwargs
class Bang123Spider(RedisCrawlSpider):
name = "bang123"
allowed_domains = ["bang123.cn"]
def __init__(self, *args, **kwargs):
# kwargs可以传递参数,如何传递呢?运行爬虫命令时:scrapy crawl 爬虫名 -a key=values
print(f"{args=}")
print(f"{kwargs=}")
super().__init__(*args, **kwargs)
方法2:
或则可以通过-s传递settings选项,然后在爬虫类中获取settings也可以!
scrapy crawl 爬虫名 -a key=values
标签:__,init,爬虫,传递,时向,Scrapy,kwargs,scrapy
From: https://www.cnblogs.com/juelian/p/17559678.html