目录
一、序
打正大杯的时候,需要面向女性群体的信息收集,当时想到爬xhs相关笔记评论的数据
本着面向csdn编程的心态,蒟蒻在csdn上狂搜各类“某网站爬虫”,什么“某网站 爬虫”,“爬虫 某网站”,“书 爬虫”, “某网站拼音 爬虫”,想得到的关键词都试过了。不同于微博、微信等偷窥技术发展极为成熟的社交媒体平台,某网站平台的爬虫可谓是少的可怜。找得到的,要么已经完全过时访问一下就是一个“404”响应,要么勉强能用但是没办法做到爬取所有评论数据。不得已,只得默默打开网页版的浏览器去battle某网站的程序猿
标签:comment,h3,self,爬虫,noteid,wordcloud,可视化,cookie,id From: https://blog.csdn.net/Schumi999/article/details/137335990