爬取搜狗微信保存mysql
创建人:紫气东来
因为工作中用到抓取微信与内外部网站进行同步,所以编写了此程序。
程序思路:用selenium模拟手机登陆,下载对应HTML,再用BeautifulSoup解析html,存放mysql
程序构建在py3.x基础上,可以优化为爬虫程序。
代码地址:https://github.com/xocom/readwx
一:使用说明
1:程序使用了selenium,所以必须先安装chrome浏览器对应插件。
插件下载地址:https://sites.google.com/a/chromium.org/chromedriver/downloads
下载对应版本的EXE文件后,拷贝到chrome浏览器的目录,比如:C:\Program Files (x86)\Google\Chrome\Application
V56-V57版本的chrome可以直接用plugin下的chromedriver
2:建立表结构之后,修改运行test.py,数据会抓取到对应表。