首页 > 其他分享 >scrapy命令

scrapy命令

时间:2023-04-20 09:22:16浏览次数:34  
标签:name Scrapy spider 命令 scrapy 爬虫 crawl

scrapy常用命令:

1. scrapy startproject project_name:创建一个新的 Scrapy 项目。

2. scrapy genspider spider_name domain:创建一个新的 Scrapy 爬虫。

3. scrapy crawl spider_name:运行指定的 Scrapy 爬虫。

4. scrapy list:列出当前 Scrapy 项目中所有可用的爬虫。

5. scrapy shell url:打开一个 Scrapy shell,以便在命令行中进行调试和测试。

6. scrapy view url:在默认浏览器中打开指定的 URL。

7. scrapy version:显示当前 Scrapy 的版本信息。

scrapy高级命令:

1. scrapy crawl spider_name -o output_file.json:将爬取的数据保存到指定的 JSON 文件中。

2. scrapy crawl spider_name -o output_file.csv:将爬取的数据保存到指定的 CSV 文件中。

3. scrapy crawl spider_name -s LOG_FILE=log_file.log:将日志输出到指定的文件中。

4. scrapy crawl spider_name -s JOBDIR=job_directory:将作业的中间状态保存到指定的目录中。

5. scrapy crawl spider_name -a argument_name=value:将参数传递给 Scrapy 爬虫。

crawl模板命令:

1. scrapy startproject -d template_path project_name:使用指定的模板路径创建一个新的 Scrapy 项目。

2. scrapy genspider -t crawl spider_name domain:使用crawl模板创建一个新的 Scrapy 爬虫。

3. scrapy deploy -l:列出当前可用的 Scrapy 项目部署目标。

4. scrapy deploy -d target_name:将当前 Scrapy 项目部署到指定的目标。

标签:name,Scrapy,spider,命令,scrapy,爬虫,crawl
From: https://www.cnblogs.com/full-stack-linux-new/p/17335463.html

相关文章

  • ip addr命令解析
    转载请注明出处:1.ip addr命令使用解析ipaddr 命令是Linux系统中的一个网络管理工具,用于显示和配置系统中的网络接口及其地址信息。它可以列出系统中所有的网络接口及其详细信息,包括接口名称、MAC地址、IP地址、子网掩码、广播地址、网络类型、状态、传输单元大小等。......
  • Docker CLI docker compose events常用命令
    Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的Linux或Windows操作系统的机器上,也可以实现虚拟化。Docker是内核虚拟化,不使用Hypervisor是不完全虚拟化,依赖内核的特性实现资源隔离。本文主要介绍DockerCLI中d......
  • 常用的快捷键和dos命令
    常用快捷键ctrl+shift+esc打开任务管理器window+tab切换页面alt+f4关闭网页ctrl+z撤销shift+delete永久删除Dos命令打开cmd的方式1.window+r2.开始+系统+命令提示符3.在任意的文件夹下面,按住shift键+鼠标右键点击,在此处打开命令行窗口4.资源管理器的地址栏前......
  • 20230418 >windows11 slmgr/ ato 命令和kms server
    Problems:1使用win11不打算使用微软账户,如何绕过2重装Windows11或者用virtualmachines搬运都得用到的,如何临时激活。这个作为testing用途,请勿用作商业用途。 SolutionstepA:重装的时候会遇到windows11在oobe界面下要求登入Microsoft账号,但由于只是作为测试用途......
  • 华为防火墙 修改密码 过期时间的命令 manager-user password valid-days 0
    ......
  • linux系统记录用户操作命令
    #审计用户'''shellmkdir-m777-p/tmp/log2>&-declare-rHISTTIMEFORMAT='%F%T###'declare-rHISTCONTROL=''RSSHTTY=$(whoami|awk'{print$2}')if["$SSH_CONNECTION"];then  RSSH_CLIENTI......
  • kubectl apply -f --record 是否将当前创建对象创建命令保存到Annotation注解中中。
    kubectlcreate-ftomcat-app1.yaml--save-config--recordkubectlapply-ftomcat-app1.yaml--record#推荐命令 --record  #是否将当前对象创建命令保存至Annotation中,布尔型数据(true或false) --save-config  #是否将当前对象配置信息保存至......
  • 【Docker】常用命令
    1、Docker启动启动sudosystemctlstartdocker启动成功是没有任何消息提示的,要知道在Linux系统中,没有消息就表示成功设置docker开启自启systemctlenabledocker判断是否安装启动成功dockerversion出现服务端和客户端的相关信息,即表示启动成功。2、常用命令2......
  • docker常用命令
    docker要删除镜像,先要删除依赖它的容器1.删除容器dockerps#查看正在运行的容器dockerps-a#查看所有容器dockerrmcontainer_id#删除容器2.删除镜像dockerimages//查看镜像dockerrmiimage_id2.1删除其他镜像#删除nullimagesudodockerrmi$(dockerima......
  • yarn 常用命令
    安装yarnnpminstall-gyarn安装成功后,查看版本号:yarn--version创建文件夹yarnmdyarn进入yarn文件夹cdyarn初始化项目yarninit//同npminit,执行输入信息后,会生成package.json文件yarn的配置项:yarnconfiglist//显示所有配置项yarnconfigget<key>......