首页 > 编程语言 >python爬虫笔记——学习笔记—6

python爬虫笔记——学习笔记—6

时间:2024-06-10 15:55:01浏览次数:20  
标签:clip python 创建 爬虫 笔记 scrapy

爬虫笔记——学习笔记—6

1.安装scrapy

打开此电脑

![img](file:///C:/Users/Administrator/AppData/Local/Temp/msohtmlclip1/01/clip_image001.pngimage-20240610154434436

在桌面的上栏目输入cmd并打开

image-20240610154500919

再命令框中升级python:python -m pip install –upgradepip

安装scrapy : pip install scrapy

安装完成后验证是否成功:scrapy -h

![img](file:///C:/Users/Administrator/AppData/Local/Temp/msohtmlclip1/01/clip_image005.pngimage-20240610154508703

2.创建项目

继续创建项目:scrapy startproject +项目名

image-20240610154525547

在终里面创建三个三方库:

image-20240610154529942

在终端里面输入scrapy genspider 名称 网址

image-20240610154540986

打开pycharm并添加本地解释器:

image-20240610154547858

image-20240610154555059

再sattings中添加UA欺骗

image-20240610154606577

3.实现对豆瓣读书Top250榜单书名的爬取

在创建的book1中输入以下代码:

image-20240610154616537

实现翻页代码:

image-20240610154623092

实现对所有的爬取

image-20240610154633356

运行

image-20240610154639905

结果

image-20240610154717396

4.实现对电影名的爬取:

创建movie项目

image-20240610154707326

实现对所有的爬取

image-20240610154733497

运行

image-20240610154741622

结果

image-20240610154747042

标签:clip,python,创建,爬虫,笔记,scrapy
From: https://www.cnblogs.com/windfengyu/p/18240722

相关文章

  • python-数据分析-Pandas-5、DataFrame-index
    Index类型,它为Series和DataFrame对象提供了索引服务,有了索引我们就可以排序数据(sort_index方法)、对齐数据(在运算和合并数据时非常重要)并实现对数据的快速检索(索引运算)。由于DataFrame类型表示的是二维数据,所以它的行和列都有索引,分别是index和columns。Index类型的创建的比较简单......
  • 如何用python修复一张有多人图像的老照片,修复后照片是彩色高清
    要修复一张有多人图像的老照片,可以使用OpenCV库和深度学习模型。以下是一个简单的示例:```pythonimportcv2importnumpyasnpimporttensorflowastffromtensorflow.keras.modelsimportload_model#加载预训练的深度学习模型model=load_model('path/to/your/mode......
  • python常用函数
    python常用函数一、进制转换#字符串与ASCII码转换print(ord("A"))#65print(chr(65))#A#进制转换print(bin(78))#0b1001110print(oct(78))#0o116print(hex(78))#0x4eprint(int('4e',16))二、数学函数函数返回值(描述)abs(x)返......
  • 将这张图片修复为彩色高清,然后在Python中,可以使用以下库来执行上述任务
    将这张图片修复为彩色高清,然后在Python中,可以使用以下库来执行上述任务OpenCV:用于图像处理、面部检测等。dlib:用于面部检测和特征点标记。Scikit-image:用于图像处理和修复。TensorFlow或PyTorch:用于训练和使用深度学习模型,如图像修复GAN和超分辨率模型。首先,我们需要将......
  • 01-Excel初阶操作-学习笔记
    超链接专题应用场景:一份excel表格中包含多个子表,如下图所示。让我们在目录所在的子表创建超链接,使得能够快速跳转到各个子表查看数据内容,并为每一个含有数据的表格添加返回到目录所在子表的超链接手工创建超链接具体操作:我们以制作跳转至“全部数据”所在子表为例点到目录所......
  • 最新初中数学思维导图大合集+衡水高考学霸笔记,可下载打印!
    今天给大家带来一个超级实用的学习神器——思维导图法,最新版的初中数学思维导图大合集!这可不是我吹哦,连哈佛、剑桥大学都在用的高级学习方法,阿星特意为初中数学的小伙伴们整理了一份思维导图,帮你们串联知识,高效复习,理清逻辑。高清导图,文末下载哦!说起思维导图,这可不是什么......
  • python快速生成二维码及读取二维码内容 pyqrcode MyQR pyzbar
    目录效果图生成二维码方式1:pyqrcode方式2:MyQR  读取二维码效果图生成二维码方式1:pyqrcode安装pipinstallpyqrcode代码实现importpyqrcode#text为保存在二维码的内容。text为完整链接时,扫描后可直接跳转到该链接text='https://www.baidu.com/'qr=pyqrc......
  • 使用Python去除PNG图片背景
    要使用Python自动去除PNG图片的背景,你可以使用remove.bg的API,或者使用一些图像处理库如OpenCV和Pillow结合MaskR-CNN等深度学习模型。以下是一个使用Pillow库的简单示例:安装所需库:pipinstallpillownumpy使用以下代码去除背景:fromPILimportImageimportnumpyas......
  • 动手学深度学习4.10 实战Kaggle比赛:预测房价-笔记&练习(PyTorch)
    以下内容为结合李沐老师的课程和教材补充的学习笔记,以及对课后练习的一些思考,自留回顾,也供同学之人交流参考。本节课程地址:实战Kaggle比赛:预测房价_哔哩哔哩_bilibili本节教材地址:4.10.实战Kaggle比赛:预测房价—动手学深度学习2.0.0documentation(d2l.ai)本节开源代......
  • Python GUI编程:深入探索现代GUI库及其创新应用
    目录引言PythonGUI库概览1.Tkinter2.PyQt/PySide3.wxPython4.Kivy5.PyGTK6.FLTK(pyFLTK)创新应用案例1.交互式数据分析工具2.智能物联网(IoT)仪表板3.增强现实(AR)辅助设计软件4.跨平台的科学计算软件5.交互式教育软件实战示例1:使用PyQt5开发智能......