因为会点编程的缘故,所以浏览任何网站的时候都会学着去评估这个网站的价值、网站数据的实用性以及这个网站采集的难易度。
看得多了便列两条那种很容易采集的要点,希望以后做网站的人能够知道点如何保护自己的网站网站内容数据吧。
1.每个页面或者图片以序号的方式储存。
2.图片未加水印。
当然那些页面不与序号的方式储存的也是可以采集的,比如我时常针对不连贯网页的处理方法是:获得一个栏目的第1页……第N页的URL,然后继续这些URL获得每一页中真正的不连续的网页URL。
你几乎没有办法能够让别人无法采集到你的内容,你只能尽可能的增加采集的难度,比如说内容最好图文混编以及图片加水印。
标签:批量,网站,URL,采集,序号,页面,图片 From: https://www.cnblogs.com/wedb/p/17411677.html