首页 > 编程语言 >Python - Scrapy

Python - Scrapy

时间:2022-12-04 10:55:36浏览次数:66  
标签:10 12 PyProject Python scrapydemo1 ---- Scrapy 2022

1.安装第三方包

pip install Scrapy

2.创建项目

# 生成文件夹 scrapydemo1
PS E:\PyProject> scrapy startproject scrapydemo1
New Scrapy project 'scrapydemo1', using template directory 'E:\code_tool\python\lib\site-packages\scrapy\templates\project', created in:
    E:\PyProject\scrapydemo1

You can start your first spider with:
    cd scrapydemo1
    scrapy genspider example example.com


PS E:\PyProject> cd scrapydemo1
PS E:\PyProject\scrapydemo1> ls


# 文件目录结果如下:
    目录: E:\PyProject\scrapydemo1


Mode                 LastWriteTime         Length Name
----                 -------------         ------ ----
d-----         2022/12/4     10:43                scrapydemo1   # 项目的模块,引入的时候需要从这里引入
-a----         2022/12/4     10:43            265 scrapy.cfg # Scrapy部署时的文件配置


PS E:\PyProject\scrapydemo1> cd .\scrapydemo1\
PS E:\PyProject\scrapydemo1\scrapydemo1> ls


    目录: E:\PyProject\scrapydemo1\scrapydemo1


Mode                 LastWriteTime         Length Name
----                 -------------         ------ ----
d-----         2022/12/4     10:42                spiders
-a----         2022/12/4     10:43            267 items.py
-a----         2022/12/4     10:43           3658 middlewares.py
-a----         2022/12/4     10:43            365 pipelines.py
-a----         2022/12/4     10:43           3306 settings.py
-a----         2022/12/4     10:42              0 __init__.py

3.创建Spider

进入刚创建的scrapydemo1文件夹,使用genspider命令,第一个参数是Spider名称
第二个是网站名称

PS E:\PyProject\scrapydemo1\scrapydemo1> scrapy genspider quotes quotes.toscrape.com
Created spider 'quotes' using template 'basic' in module:
  scrapydemo1.spiders.quotes

https://cuiqingcai.com/31047.html

标签:10,12,PyProject,Python,scrapydemo1,----,Scrapy,2022
From: https://www.cnblogs.com/czzz/p/16949509.html

相关文章

  • Python的PyQt框架的使用-创建主窗体篇
    Python的PyQt框架的使用-构建环境篇​​一、前言​​​​二、创建主窗体​​一、前言个人主页:​​ζ小菜鸡​​大家好我是ζ小菜鸡,小伙伴们,让我们一起来学习Python的PyQ......
  • Python实现两个excel数据匹配
    Python实现两个excel数据匹配本文结合他人文章写成参考文章:https://blog.csdn.net/u010034713/article/details/110921270https://www.cnblogs.com/puresoul/p/7520198......
  • Python sql转字典
    问题返回给前端需提供键值对格式,原本查询数据库只返回值。 解决创建游标对象时填入参数cursor=pymysql.cursors.DictCursorsql="SELECTuser_id,email,nati......
  • 3、使用 TVMC Python 入门:TVM 的高级 API
    本节将介绍针对TVM初学者设计的脚本工具。开始前如果没有下载示例模型,需要先通过终端下载resnet模型:cdmyscripts/mvresnet50-v2-7-frozen.onnxmy_model.onnx......
  • PYTHON 判断引用路径的类型
    PYTHON判断引用路径的类型如下方法,用于实现在不加载模块的前提下,判断某一个python引用路径是否存在,以及属于什么类型(模块目录,模块文件,类名).用于在一些不便......
  • AI人工智能-python
    AI概念语音合成可将文字信息转化为声音信息语音识别可将语音识别为文字百度ai平台页面熟悉              创建应用     ......
  • 【python】使用百度api进行音频文件转写
     【python】使用百度api进行音频文件转写脚本目标:智能云的音频文件转写文档只给了个demo,每次只能传1分钟以内的音频啥的,不好直接用,简单打包一下,做到把音频放文件夹,直......
  • python循环
    python学习1.for循环range()函数foriinrange(1,10):print(i)#输出为123456789该函数还可以制定步长如:foriinrange(1,10,2)即为以2为步长,在1到......
  • python报错 ModuleNotFoundError: No module named ‘win32api‘
    参考链接https://blog.csdn.net/weixin_43149311/article/details/120806116报错信息如下:ModuleNotFoundError:Nomodulenamed‘win32api‘解决方法参考1.重新......
  • 在linux虚拟机中运行python
    在linux虚拟机中运行python方法1:运用python指令运行一般情况linux系统会自动安装python所以在终端中输入python3就自动进入python的交互模式输入ctrl+z退出交互模式......