Wereadscan 介绍
Wereadscan 是一个用于扫描“微信读书”已购图书并下载为本地 PDF 的爬虫工具。它将微信读书上的图书转换为本地 PDF/HTML 格式,尽管“微信读书”是一个优秀的平台,但用户只能在应用中阅读和做简单批注,缺乏类似纸质书籍的功能,比如手写笔记。为了填补这一空缺,开发者经过两天的努力,创建了这个爬虫脚本,使得用户可以轻松将书籍转换为可在其他应用中编辑和注释的格式。
项目背景
该项目参考了 Sec-ant 的解决方案 weread-scraper,整合了获取 #preRenderContent
的关键部分,推出了 WeReadScan-HTML 版本,可以更高效地批量获取图书的 HTML 内容。需要注意的是,该脚本依赖于 Selenium,用户需具备基础的使用知识。此外,项目仅限于已购图书的个人学习,禁止用于商业用途或传播,以尊重“微信读书”的权益。
Wereadscan 扫描效果
Wereadscan - 扫描“微信读书”已购图书并下载为本地 PDF 的爬虫。
使用方法
# 克隆项目
git clone https://gitee.com/Algebra-FUN/WeReadScan.git
# 进入项目目录
cd WeReadScan
# 安装依赖
pip install -r requirements.txt
# 运行爬虫
python wereadscan.py
访问链接
- Gitee: https://gitee.com/Algebra-FUN/WeReadScan
- 官网: https://algebra-fun.github.io/WeReadScan/
- GitHub: https://github.com/Algebra-FUN/WeReadScan