首页 > 其他分享 >批量抓取公众号阅读数点赞数在看数留言数进行数据分析

批量抓取公众号阅读数点赞数在看数留言数进行数据分析

时间:2023-01-01 21:45:19浏览次数:64  
标签:False 赞数 数点 点赞数 阅读数 看数 wechat 文章

原文:

视频更新版:批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/留言数​mp.weixin.qq.com/s/c-jpCXxUtZpzxTCSx0Fu_w

抓取下载的文章数据excel,数据包含文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数,留言数,赞赏次数等,比如深圳卫健委这个号的阅读数都是10万+。

接着用python pandas分析excel里的数据 :

听说公众号深圳卫健委被网友投诉尺度大,我抓取了所有文章标题和阅读数分析了下​mp.weixin.qq.com/s?__biz=MzIyMjg2ODExMA==&mid=2247493426&idx=1&sn=0e8b5277f7b9e8f2999fa0fe0c5f83e6&scene=21#wechat_redirect

wechat=pd.read_csv('xxx公众号历史文章.csv',encoding='utf-8')

查看文章总数:

len(wechat)

查看阅读数总数:

>>> wechat.阅读数.sum()
8191166

文章量发布作者前5:

>>> wechat.文章作者.value_counts().sort_values(ascending=False).head(5)
xxx    331
Name: 文章作者, dtype: int64

阅读数大于10万+文章列表:

>>> wechat[wechat.阅读数>100000]
           文章日期                  文章标题                                               文章链接  ...     阅读数  在
看数   点赞数
139  2021-08-08  xxx   mp.weixin.qq.com/s...  ...  100001
 825  1742

[1 rows x 12 columns]

阅读数排行前10的文章列表:

>>> wechat[['文章日期','文章标题','文章链接','阅读数']].sort_values(by='阅读数', ascending=False).head(10)

阅读数点赞数在看数平均值:

>>> wechat[['阅读数','点赞数','在看数']].mean()
阅读数    24746.725076
点赞数      622.480363
在看数      260.145015
dtype: float64

头条的阅读数点赞数在看数平均值:

>>> wechat[wechat.文章位置 == 1][['阅读数','点赞数','在看数']].mean()
阅读数    28413.407407
点赞数      667.126984
在看数      276.148148
dtype: float64

头条和次条文章数:

wechat.groupby('文章位置',as_index=False).agg({"在看数":'count'}).sort_values(by=['在看数'],ascending=False).head(5)
>>> wechat.文章位置.value_counts().sort_values(ascending=False).head(5)
1    189
2    142
Name: 文章位置, dtype: int64
wechat.query('文章位置 == 2')

原创文章数:

wechat.groupby('是否原创').agg({"在看数":'count'}).sort_values(by=['在看数'],ascending=False).head(5)
>>> wechat.是否原创.value_counts().sort_values(ascending=False).head(5)
是    331
Name: 是否原创, dtype: int64

更多我写的工具:

更新版:整理下苏生不惑开发过的那些工具和脚本​mp.weixin.qq.com/s/u9PTjbR5B5-od9fC_lyXLA

标签:False,赞数,数点,点赞数,阅读数,看数,wechat,文章
From: https://www.cnblogs.com/susheng/p/17018662.html

相关文章

  • Mysql - 查看数据库版本,登录,show语句,use 选择数据库
    1.查看数据库版本#登录之前CMD命令查看mysql--version#登录之后mysql语句查看SELECTVERSION();2.登录mysql-u用户名-hIP地址-P端口-p密码mysql-......
  • vue保留小数点后两位
    //保留小数点后两位,四舍五入numFilter(value){letrealVal=parseFloat(value).toFixed(2);returnrealVal;},//保留小数点后两位,不四舍五入numFilter(va......
  • UIKeyboardTypeDecimalPad键盘上小数点变成逗号的问题
    最近测试反馈一个问题就是输入金额的键盘上小数点变成了逗号,如下图所示查了一下发现是因为手机系统设置的地区所导致的,部分欧洲地区键盘上小数点即为逗号如果APP不支持......
  • numpy中查看数组的形状和改变数组的维度
    1.查看数组的形状2.改变数组的维度......
  • 库函数点灯
    库函数点灯一、配置流程开启GPIO的端口时钟配置GPIO的模式配置GPIO的输出我们以LED2(PD7)为例进行配置在使用库函数之前,我们需要了解到,GD32官方帮我们做好了......
  • js校验输入0-1之间的小数,最多保留小数点后两位
    varreg=/^0\.[1-9]{0,2}$/;varlinka=0.1;console.log(reg.test(linka)); 0到1两位小数正则^(0\.(0[1-9]|[1-9]{1,2}|[1-9]0)$)|^1$不含0、0.0、0.00 /......
  • mongodb查看数据库和表的信息
    mongodb查看数据库和表的信息mongodb查看数据库和表的方法比较简单,在为这里推荐使用stats的方法,直观并且详细。1、查看数据库db.stats();1输出:{"db":"sirius","colle......
  • 从全球顶级数据库大会 SIGMOD 看数据库发展趋势
    本文来自NebulaGraph的软件工程师文豪在美国费城参加2022年SIGMOD大会时的见闻。SIGMOD是数据库领域的顶级会议之一,是CCF数据库/数据挖掘/内容检索领域A类......
  • 从redis源码看数据结构(一)链表
    文章目录​​从redis源码看数据结构(一)链表​​​​一,redis数据类型​​​​二,redis底层列表实现​​​​1.列表底层数据结构​​​​2.redis双向链表操作​​​​新建链表​......
  • 纯数字校验(一个小数点)
    输入数量时需要手动校验,在输入框中加上onkeyup="if(isNaN(value))execCommand('undo')"onafterpaste="if(isNaN(value))execCommand('undo')"之后,输入第二个小数点或者非......