• 2024-08-31GitHub 上这款新浪微博爬虫项目,‌让你轻松掌握微博数据!‌
    该文章为weibo-crawler的官方文档,为了方便国内的同学阅读而转载。原文地址:https://github.com/dataabc/weibo-crawler源码我也下载了一份,读者可以在我的公众号上回复“分享资料”来获取,路径如下:​‍‍以下是正文:功能连续爬取一个或多个新浪微博用户(如迪丽热巴、郭碧婷)的
  • 2024-08-30一个批量爬取微博数据的神器
    100.一个批量爬取微博数据的神器分享一个能批量下载微博图片/视频/评论的工具‍起因偶尔玩玩微博,最近看到了一名专业的coser,因此想要下载一些她的微博,方便观看,也避免以后平台倒闭/博主退坑的情况导致无法看原微博。​专业coser:鲨鱼SAME‍项目介绍然后我在GitHub上搜
  • 2024-06-11Redis之发布订阅
    发布订阅Redis发布订阅(pub/sub)是一种消息通信模式,发送者(pub)发送消息,订阅者(sub)接收消息。Redis客户端可以订阅任意数量的频道。消息发送者&消息接收者&频道可以想象这么一个场景。我们抖音、微博关注了哪个博主,当他发布一条文章时,系统就会给我们推送他发布的消息内
  • 2024-05-29用Python写一个热点事件追踪的算法
     要编写一个热点事件追踪的算法,首先需要明确算法的主要目标和所需的数据。在这个例子中,我们将基于微博的热度(如点赞数、转发数和评论数)来追踪热点事件。以下是一个简单的Python算法,仅供参考: 1.导入所需库 ```pythonimportrequestsfrombs4importBeautifulSoupimp
  • 2023-12-20python代码实现保存微博文娱榜的数据Ajax异步加载
    最近有小伙伴看完蜜蜂之前分享的爬虫文章之后,使用python代码实现了自动保存网站上面的图片到本地,但是最近又有新的需求。需求描述:爬取微博文娱榜的数据,并保存到csv文件中网址:https://weibo.com/hot/entertainment需要将一下框上的两个字段都爬取下来。对于这样的需求,看过蜜蜂之前
  • 2023-12-19Request+Python微博爬虫实战
    1Request爬虫基础Request爬虫基本步骤:1、构造URL;2、请求数据;3、解析数据;4、保存数据例:爬取豆瓣某图片importrequests#第1步:构造URLurl='https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2624516210.jpg'#第2步:请求数据r=requests.get(url)#第3步:解
  • 2023-11-28微博授权登录获取个人信息
    新建应用https://open.weibo.com/apps接url=>回调获取code=>利用code换取uid和access_token=>使用access_token获取用户信息#新浪微博登录地址组合返回(第一步)classweibo(APIView):defget(self,*args,**kwargs):#微博接口地址weibo_auth_u
  • 2023-08-18离线数据统计及词云图显示
    小时级实时数据仓库构建方法_A项目项目描述天亮舆情是一个简单易用的互联网舆论分析平台。通过对互联网常见的舆论信息传播媒介进行采集分析,提供了实时舆情、情感分析、地域统计及事件脉络等数据与分析能力,助力客户把握时事脉搏。用户只需设置关键词即可实现对全互联网的信息进行检
  • 2023-05-31大数据处理的关键架构
    大数据处理的关键架构层: 大数据处理的关键架构层 摘自:http://weibo.com/ttarticle/p/show?id=2309403960679466973487
  • 2023-05-20单点登陆社交登陆
    单点登陆社交登陆OAuth2.0OAuth2.0使用微博社交登陆https://open.weibo.com/connect开发手册https://open.weibo.com/wiki/%E6%8E%88%E6%9D%83%E6%9C%BA%E5%88%B6%E8%AF%B4%E6%98%8E更换YOUR_CLIENT_IDAppKey:1514335119更换YOUR_REGISTERED_REDIRECT_URIOAuth2
  • 2023-05-141076 Forwards on Weibo
    题目: WeiboisknownastheChineseversionofTwitter.OneuseronWeibomayhavemanyfollowers,andmayfollowmanyotherusersaswell.Henceasocialnetworkisformedwithfollowersrelations.WhenausermakesapostonWeibo,allhis/herfollowers
  • 2023-05-06腾讯、新浪微博 oauth安全认证
    在做一个需要调用微博接口的项目中.发现了一些问题1.腾讯微博sdk的封装粒度不够,需要在其上做二次开发2.新浪,腾讯微博没有实现统一的接口,在做项目的时候需要将它们分开来实现,代码看起来很别扭我所做的就是解决了以上两个问题,所以现在做微博应用
  • 2023-04-01代码
    importtimeimportxlrdfrom seleniumimportwebdriverfromselenium.webdriver.common.keysimportKeysimportosimportrequestsimportjsonimportexcelSaveassaveimportrefromselenium.webdriver.common.byimportByfromselenium.webdriver.support.u
  • 2023-03-30python_Package相关
    将自己的工作,构建为python的Package并上传至PYPI,使得其他开发者可以通过pip安装并使用。这是我一直想做的事情,最近我成功将微博数据采集项目封装并上传至PYPI。为使得后续
  • 2023-03-15SPARK 使用Java 在IDE中实战RDD和DataFrame动态转换操作
    /***王家林老师授课​​​http://weibo.com/ilovepains​​*/ 源文件1,Spark,72,Hadoop,113,Flink,5 运行结果 
  • 2022-12-06苏东坡谐音梗
    谐音梗:苏东坡只喜欢待在家里,因为那是他的苏轼区。那苏东坡老想出去玩,是不是想逃离苏轼区?孙悟空抱怨道:“师傅!我让你在这个圈子内别出来,你怎么不听?”唐僧道:“因为你把圈
  • 2022-11-15加密小猿微博
    下面本人微博https://weibo.com/u/2434823180欢迎私信交流 
  • 2022-10-29认证服务-OAuth2.0
    1.OAuth2.0简介1.社交登录2.OAuth2.0OAuth2.0:OAuth(开放授权)是一个开放标准,对于用户相关的OpenAPI(例如获取用户信息,动态同步,照片,日志,分享等),为了保护用户数据
  • 2022-10-10微博指数的数据爬取
    总有那么几个网站总是不按照套路出牌。那么微博指数必然是属于其中之一。1.找到微博指数的网站进入之后,你就会发现界面压根就没有任何的数据。   那么在这个界面呢
  • 2022-10-02一个爬虫使用教程
    前言用了\(GitHub\)上一个项目作为载体,该项目中有些代码需要修改https://github.com/dataabc/weibo-search/安装python准备工作进入\(weibo-search-master\)
  • 2022-10-02#yyds干货盘点#【愚公系列】2022年10月 Go教学课程 037-面向对象综合案例-微博
    一、面向对象综合案例-微博微博(Micro-blog)是指一种基于用户关系信息分享、传播以及获取的通过关注机制分享简短实时信息的广播式的社交媒体、网络平台。微博允许用户通过
  • 2022-09-22Mysql ibdata 丢失或损坏如何通过frm&ibd 恢复数据
    mysql存储在磁盘中,各种天灾人祸都会导致数据丢失。大公司的时候我们常常需要做好数据冷热备,对于小公司来说要做好所有数据备份需要支出大量的成本,很多公司也是不现实的。万