信息表示方式 | Python库 |
---|---|
静态网页 | urlib、requests、Beautiful Soup、re |
动态网页 | Selenium 和 PhantomJS |
爬虫框架 | Scrapy |
数据存储 | CSV文件、TXT文本或JSON文本,也可以保存到MySQL和MongoDB |
信息表示方式 | Python库 |
---|---|
静态网页 | urlib、requests、Beautiful Soup、re |
动态网页 | Selenium 和 PhantomJS |
爬虫框架 | Scrapy |
数据存储 | CSV文件、TXT文本或JSON文本,也可以保存到MySQL和MongoDB |