scrapy shell && ipython

时间：2023-01-04 10:57:40浏览次数：48

标签：xpath shell selector scrapy 终端 ipython response

scrapy shell ：

Scrapy终端，是一个交互终端，供您在未启动spider的情况下尝试及调试您的爬取代码。其本意是用来测试提取数据的代码，不过您可以将其作为正常的Python终端，在上面测试任何的Python代码。该终端是用来测试XPath或CSS表达式，查看他们的工作方式及从爬取的网页中提取的数据。在编写您的spider时，该终端提供了交互性测试您的表达式代码的功能，免去了每次修改后运行spider的麻烦。一旦熟悉了Scrapy终端后，您会发现其在开发和调试spider时发挥的巨大作用。 ipython： 简介：如果您安装了 IPython ，Scrapy终端将使用 IPython (替代标准Python终端)。 IPython 终端与其他相比更为强大，提供智能的自动补全，高亮输出，及其他特性。

应用：

# 进入到scrapy shell的终端  直接在window的终端中输入scrapy shell 域名
# 如果想看到一些高亮 或者 自动补全  那么可以安装ipython  pip install ipython

# scrapy shell www.baidu.com



（1）scrapy shell www.baidu.com
（2）scrapy shell http://www.baidu.com
(3) scrapy shell "http://www.baidu.com"
(4) scrapy shell "www.baidu.com"
语法：
（1）response对象：
response.body
response.text
response.url
response.status
（2）response的解析：
response.xpath() （常用）
使用xpath路径查询特定元素，返回一个selector列表对象
response.css()
使用css_selector查询元素，返回一个selector列表对象
获取内容 ：response.css('#su::text').extract_first()
获取属性 ：response.css('#su::attr(“value”)').extract_first()
（3）selector对象（通过xpath方法调用返回的是seletor列表）
extract()
提取selector对象的值
如果提取不到值 那么会报错
使用xpath请求到的对象是一个selector对象，需要进一步使用extract()方法拆
包，转换为unicode字符串
extract_first()
提取seletor列表中的第一个值
如果提取不到值 会返回一个空值
返回第一个解析到的值，如果列表为空，此种方法也不会报错，会返回一个空值
xpath()
css()
注意：每一个selector对象可以再次的去使用xpath或者css方法

标签：xpath,shell,selector,scrapy,终端,ipython,response
From： https://www.cnblogs.com/zhaolei0419/p/17024245.html

【Linux】Ubuntu18.04 设置开机自启动shell脚本
需求：我有一个功能，需要打开 termial终端手敲命令启动，每次开机都要手动执行一次命令，很不方便，能否设置为开机自动启动？解决方案：1.进入/lib/systemd/system能看到有很多启......
linux命令shell执行
新建一个文件test.sh，扩展名为sh（sh代表shell），扩展名并不影响脚本执行，见名知意就好，如果你用php写shell脚本，扩展名就用php好了。输入一些代码，第一行一般是这样：实例#!/bi......
Shell 变量
定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如：your_name="http://runoob.com"注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，......
不容错过这十款 GNOME Shell 扩展
当GNOME Shell（即GNOME3）最初进军 Linux 世界时，众多批评人士指出其灵活性有所欠缺。当初外观有所突破的GNOME确实会给生产效率带来一些影响，然而它多年来一......
主题 2 Shell工具和脚本
主题2Shell工具和脚本Shell工具和脚本·themissingsemesterofyourcseducation(missing-semester-cn.github.io)Shell脚本shell脚本是一种更加复杂度的工具......
Shell字符串截取（非常详细）
一、从指定位置开始截取1）从字符串的左边开始截取（下标计数从0开始）如果想从字符串的左边开始计数，那么截取字符串的具体格式如下：${string:start:length}其中，string是......
linux的shell的概述
Shell教程Shell是一个用C语言编写的程序，它是用户使用Linux的桥梁。Shell既是一种命令语言，又是一种程序设计语言。Shell是指一种应用程序，这个应用程序提供了一个界面......
基于linux下的shell中常用的控制语句
学习目标：for语句while语句if语句case语句expect语句exitbreakcontinue退出命令的区别：exit直接退出当前脚本break仅仅退出本次循环continue退出本次循环进行下一次循......
基于linux下的shell变量
变量的定义：变量即在程序运行过程中它的值是允许改变的量，变量是用一串固定的字符来标志不固定的值的一种方法，变量是一种使用方便的占位符，用于引用计算机内存地址，该地址可以存......
基于linux下的shell中的运算及应用实例
运算方式及运算符号:运算符号意义(*标示常用)+,-加法,减法*,/,%乘法,除法,取余**幂运算++,--自增加,自减少<,<=,>,>=比较符号=,+=,-=,*=,......

scrapy shell && ipython

相关文章

赞助商

阅读排行