首页 > 其他分享 >爬虫基础——静态网页与动态网页

爬虫基础——静态网页与动态网页

时间:2022-09-26 15:23:40浏览次数:47  
标签:网页 静态 爬虫 URL 动态 页面

爬虫基础——静态网页与动态网页

  • 在爬虫前应首先名确待爬取的页面是静态的,还是动态的,只有确定了页面类型,才方便后续对网页进行分析和程序编写。对于不同的网页类型,编写爬虫程序时所使用的方法也不尽相同

静态网页

  • 静态网页是标准的 HTML 文件,通过 GET 请求方法可以直接获取,文件的扩展名是.html、.htm等,网面中可以包含文本、图像、声音、FLASH 动画、客户端脚本和其他插件程序等。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。静态并非静止不动,它也包含一些动画效果

  • ,网页的生成速度会降低,由于静态网页的内容相对固定,且不需要连接后台数据库,因此响应速度非常快。但静态网页更新比较麻烦,每次更新都需要重新加载整个网页。

  • 静态网页的数据全部包含在 HTML 中,因此爬虫程序可以直接在 HTML 中提取数据。通过分析静态网页的 URL,并找到 URL 查询参数的变化规律,就可以实现页面抓取。

动态网页

  • 动态网页指的是采用了动态网页技术的页面,它不需要重新加载整个页面内容,就可以实现网页的局部更新。动态页面使用“动态页面技术”与服务器进行少量的数据交换,从而实现了网页的异步加载。
  • 抓取动态网页的过程较为复杂,需要通过动态抓包来获取客户端与服务器交互的 JSON 数据。抓包时,可以使用谷歌浏览器开发者模式(快捷键:F12)Network选项,然后点击 XHR,找到获取 JSON 数据的 URL,或者使用专业的抓包工具 Fiddler。

标签:网页,静态,爬虫,URL,动态,页面
From: https://www.cnblogs.com/yangzilaing/p/16731058.html

相关文章

  • PC端网页特效-元素偏移量 offset 系列
    PC端网页特效—元素偏移量offset系列1.offset概述​offset翻译过来就是偏移量,我们使用offset系列相关属性可以动态的得到该元素的位置(偏移)、大小等。获得元素......
  • Python爬虫快速入门指南
    笔者近期需要使用爬虫技术来爬取某网页上的数据,因此学习了一下Python爬虫技术,正好最近也在学习Javaweb和spring相关技术,借此过程巩固一下相关基础知识。1了解基础知识①......
  • 静态资源映射
    #设置classpath目录下的WEB-INF文件夹内容修改不重启spring.devtools.restart.exclude=static/**#自定义静态文件访问地址spring.devtools.restart.exclude=stati......
  • .Net Core 静态类获取注入服务
    由于静态类中无法使用有参构造函数,从而不能使用常规的方式(构造函数获取)获取服务,我们可以采取通过IApplicationBuilder获取1.首先创建一个静态类usingMicrosoft.A......
  • static静态变量的理解
    静态变量类型说明符是static。静态变量属于静态存储方式,其存储空间为内存中的静态数据区(在静态存储区内分配存储单元),该区域中的数据在整个程序的运行期间一直占用这些存......
  • 第一个网页练习
    步骤一、观察设计稿 设计稿大致分为两部分:body背景、article包含header二、创建工程,index.html+index.css+reset(样式重置)1.创建工程2.链接css  <linkrel......
  • 每个网页设计师都应该知道的 CSS 技巧
    每个网页设计师都应该知道的CSS技巧1.字体速记像往常一样,我们将字体样式编写如下字体粗细:粗体;字体样式:斜体;字体变体:小型大写;字体大小:1em;行高:1.5em;......
  • 【Linux】【虚拟机】 IP地址的动态与静态设置
    目录配置文件的修改配置文件的修改vim/etc/sysconfig/network-scripts/ifcfg-ens33IP配置方式(不指定:none,静态:static,动态:dhcp)如果想将动态地址改为静态地址,将dhcp改......
  • 静态static
    static是静态的意思,在程序中,可以直接通过类名进行访问,不需要创建对象。而且每一个对象都能调用该静态方法。并且,静态方法里面调用的,也应该是静态类型。并且不会因为对象的......
  • 盘点一个Python抓取有道翻译爬虫中的报错问题
    大家好,我是皮皮。一、前言前几天在Python白银交流群【斌】问了一个Python网络爬虫的问题,提问截图如下:报错截图如下:粉丝需要的数据如下:二、实现过程有道翻译之前有......