首页 > 其他分享 >一个爬虫使用教程

一个爬虫使用教程

时间:2022-10-02 21:00:09浏览次数:81  
标签:weibo 教程 search py 爬虫 install 使用 pip txt

前言

用了 \(GitHub\) 上一个项目作为载体,该项目中有些代码需要修改

https://github.com/dataabc/weibo-search/

安装python

准备工作

  • 进入 \(weibo-search-master\)

  • 进入 \(cmd\)

  • 安装所需要的库:
    • pip install scrapy
    • pip install -r requirements.txt
    • pip install jieba
    • pip install matplotlib
    • pip install imageio

设置参数

  • 进入 \(weibo\)

  • 打开 \(settings.py\)

  • 修改搜索词,开始日期,结束日期。

爬取

  • 进入 \(weibo-search-master\)

  • 进入 \(cmd\)

  • 执行 scrapy crawl search

  • 等待爬取,不要点击

  • 得到结果文件文件夹,结果为 \(csv\) 格式

  • 将 \(csv\) 改成英文名防止路径中文编码

统计

  • 进入结果 \(csv\) 文件,把除了评论内容的列全部手动删除

  • 执行 \(changeCsvToTxt.py\)
    设置输入输出文件路径

  • 得到 \(txt\)

  • 执行 \(wordsCount.py\),得到词云图和词频 \(txt\)。

标签:weibo,教程,search,py,爬虫,install,使用,pip,txt
From: https://www.cnblogs.com/misasteria/p/16749444.html

相关文章

  • 使用java将数字转化为中文汉字
    在实际开发过程中,会有遇到需要将传入的数字参数转化为汉字用来展示的情况,这里给出自己的思考,供给大家参考。publicstaticvoidconvert(intnumber){//数字对......
  • 使用IDEA进行javaDoc时报错:javadoc: 错误 - 无效的标记: --source-path
    可能是因为idea版本太高其javadoc生成工具不能使用java8版本了,亦或是需要做一些设置 idea生成javadoc文件使用java8版本时报错  在这里修改一下java版本 我......
  • tushare使用
    tushare简介平台链接:https://tushare.protushare有个积分制度,具备一定积分级别的用户才能调用该等级的api。流程大概就是:注册,完善信息,然后加tushare的群。完成这个流程......
  • 为python编译C++模块时一定要注意的事情—————不要在anaconda环境下使用cmake来编
    平时搞python的人很多都会有安装C++扩展模块的需求,而往往这些C++模块都是使用CMAKE做编译配置的,但是如果你这时候shell环境是使用anaconda的话,那么cmake默认调用的GCC和G++......
  • C# QuestPDF常规使用
     以下是demo代码环境是在 api中 publicclassTestModel{publicstringName{get;set;}="测试";publicdecimalPrice{get;......
  • ABAP使用WRITE画表格
    WRITE:/1(Y)SY-ULINE."输出长度为Y的横线LOOPATLTINTOLS.WRITE:/1SY-VLINENO-GAP,"不写X时,默认为字段长度,居中必须指定X占位长度(X)LS-F......
  • 使用Google Bigquery快速用SQL查询Excel数据
    1. 在GoogleBigquery新建项目之后,通过上传文件添加数据集  2. 通过SQL查询窗口查询数据 ......
  • 常用工具系列---【ZoomIt的使用方法】
    ZoomIt的使用方法ZoomIt是一款非常强悍的教学辅助软件,具有屏幕放大、屏幕标注、计时功能,软件占用空间只有0.2M,且无需安装。下面我介绍一下此软件的使用方法。屏幕放大......
  • Lombok使用(二)
    Data@Data//相当于@getter@setter@ToString@EqualsAndHashCode,但需要所有属性的值相同才是同一个对象@EqualsAndHashCode(of={"id"})publicclassUserIn......
  • final基本使用
    1基本介绍final中文意思:最后的,最终的.final可以修饰类、属性、方法和局部变量.在某些情况下,程序员可能有以下需求,就会使用到final:1)当不希望类被继承时,可以用fin......