第一步:从官网或者github下载代码,导入idea,使用maven来加载包,修改配置信息,之后运行
第二步,输入在浏览器打开项目。PS:端口号根据项目配置进行修改
第三步,点击左侧【爬虫列表】,右上方的按钮【新建爬虫】
第四步,来到这个界面,选择左侧一个小爬虫样式的【开始抓取】图标,使用的过程记得点击上面的保存【ctrl+s】进行实时的保存,防止数据丢失
第五步,选择【开始】图标,边框显示为绿色,同时鼠标按住左键,向外延伸,连接上【开始抓取】图标,这代表【开始】图标执行完成之后,执行【开始抓取】
第7步,我们在左侧抓取一个【变量】图标,和【开始抓取】图标连接,并且新建一个变量名,如图所示
为什么要这么抓取呢?因为没新闻信息是一个div,我们通过谷歌浏览器去查询,通过class属性就可以就可以获取到这个div
第8步,我们在左侧抓取一个【输出】图标,和【变量】图标连接,安装如图所示进行配置,点击左上角的运行按钮,我们就可以看到输出的结果了