首页 > 其他分享 >公众号文章批量下载神器又更新了,解放双手,一键下载

公众号文章批量下载神器又更新了,解放双手,一键下载

时间:2023-01-01 21:45:08浏览次数:61  
标签:视频 url 一键 神器 video 文章 pdf 下载

原文:

公众号批量下载神器又更新了,解放双手,一键下载​mp.weixin.qq.com/s/md-26TD4VkbMiwlyFjfXXQ
苏生不惑第392篇原创文章,将本公众号设为星标,第一时间看最新文章。

之前分享过我写的公众号批量下载工具视频更新版:批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/留言数 ,根据有些小伙伴的反馈周末我又更新了下,增加了文章封面下载,图片下载,使用很简单,下载软件打开后输入文章链接就行,效果如图:

为了方便查找文件,这次把下载的音频保存在audio目录,视频保存在video目录,封面保存在cover目录,图片保存在images目录,文章内容保存在html目录。

另外还有文章里的腾讯视频地址解析,由于直接下载腾讯视频比较麻烦,所以保存到excel文件里,可以再复制视频链接用http://github.com/iawia002/lux下载。

代码如下:

vids = re.findall(r'vid=(wxv_\d{19})',res.text)
    videos = re.findall(r"source_link\: xml \? getXmlValue\(\'video_page_info\.source_link\.DATA\'\) : \'http://v\.qq\.com/x/page/(.*?)\.html\'\,",res.text)
    if not os.path.exists('video'):
        os.mkdir('video')
    # time.sleep(2)
    for i in videos:
        print(f'视频地址:http://v.qq.com/x/page/{i}.html')
        with open('视频链接合集.csv','a+') as f4:
f4.write(date+','+trim(title)+','+f'http://v.qq.com/x/page/{i}.html'+','+article_url+'\n')
    for vid in vids:
        url = f'https://mp.weixin.qq.com/mp/videoplayer?action=get_mp_video_play_url&preview=0&vid={vid}'
        data = requests.get(url,headers=headers,timeout=1).json()
        video_url = data['url_info'][0]['url']
        video_data = requests.get(video_url,headers=headers)
        with open('视频链接合集.csv','a+') as f4:
            f4.write(date+','+trim(data['title'])+','+video_url+','+article_url+'\n')
        print('下载视频:'+trim(data['title'])+'.mp4')
        with open('video/'+date+'_'+trim(data['title'])+'.mp4','wb') as f:
            f.write(video_data.content)

第2次下载会跳过已经下载过的文章,有什么问题可以向我反馈。

 

下载的文章内容html可以用我开发的html2pdf批量转换为pdf,先从https://wkhtmltopdf.org/downloads.html 下载安装,再添加到环境变量,运行html2pdf.exe就可以了,批量转换后的pdf文件保存在pdf目录。

然后用我开发的pdf_merge.exe合成一个pdf文件苏生不惑又写了个pdf合并带书签小工具 ,效果:

文件名为书签,点击会跳转对应文章。

除了文章链接,公众号话题下载我也写了个下载工具,比如这个话题:

 

输入话题链接下载效果如图:

还有模板主页文章批量下载,比如支付宝这个模板页面:

下载效果如图:

 

批量下载公众号所有文章的内容/音频/视频在之前文章批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/在看数/留言数/赞赏数 分享过 ,比如莫言老师公众号的所有文章内容和音频,视频 :

 

最后将所有文章合并成一个pdf文件(含留言),点击左侧文章标题书签跳转到对应文章:

 

除了下载文章内容还有文章数据,包含文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数和留言数,赞赏数,视频数,音频数等,抓取过深圳卫健委的公众号数据听说公众号深圳卫健委被网友投诉尺度大,我抓取了所有文章标题和阅读数分析了下 ,看阅读数都是10万+。

另外为了方便翻历史文章,部分公众号同步到了我的博客https://sushengbuhuo.github.io/blog ,不用在手机上翻历史文章了 ,比如深圳卫健委从2014到2022发布1万多篇文章,第一篇文章是这个:

每个月我还会更新一次公众号深圳卫健委的封面表情包图,无水印,欢迎收藏 2022 年 10 月公众号深圳卫健委历史文章无水印封面表情包,分享到网盘了 ,所有封面图的文件名为文章发布日期加标题,方便搜索,在公众号后台回复 封面 获取这个号2019-2021年的所有封面图,2022年结束的时候我再下载2022封面图。

每篇文章下的留言内容也可以导出到excel(包含文章日期,文章标题文章链接,留言昵称,留言内容,点赞数,回复和留言时间),比如深圳卫健委一个月就有1万6千多条留言。

 

最近原创文章:

加入我的知识星球

视频更新版:批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/留言数/赞赏数

一键批量下微博内容/图片/视频,获取博主最受欢迎微博,图片查找微博博主

百度搜索取消快照,又一个互联网历史性事件,很多人还不知道

录制了个视频:2022年11月一键下载百度网盘/百度文库/豆丁/道客巴巴/原创力文档

更新版:整理下苏生不惑开发过的那些工具和脚本

如果文章对你有帮助还请 点赞/在看/分享 三连支持下, 感谢各位!

标签:视频,url,一键,神器,video,文章,pdf,下载
From: https://www.cnblogs.com/susheng/p/17018664.html

相关文章