首页 > 其他分享 >爬虫 1(入门基础)

爬虫 1(入门基础)

时间:2024-04-26 12:01:59浏览次数:21  
标签:HTTP 请求 URL 基础 爬虫 入门

爬虫 1(入门基础)

一、什么是爬虫

通过编写代码,模拟正常用户使用浏览器的过程,使其能够在互联网自动进行数据抓取

二、HTTP协议

image-20240423155438949

三、URL是什么

URL:资源定位符,是用于完整地描述Internet上网页和其他资源的地址的一种标识方法

image-20240423160217462

四、Header请求头

image-20240423161428479

image-20240423161502137

五、请求头参数的含义

image-20240423161804279 image-20240423161819002 image-20240423161943982 image-20240423162004304 image-20240423162112716 image-20240423162242693

六、requests库

image-20240423162541549

1、GET请求

image-20240425165458517 image-20240423164842076 image-20240425165620025

2、POST请求

image-20240423165456611

标签:HTTP,请求,URL,基础,爬虫,入门
From: https://www.cnblogs.com/dxmstudy/p/18159752

相关文章

  • 爬虫2(页面解析和数据提取)
    爬虫2(页面解析和数据提取)处理HTML文件,常用Xpath,先将HTML文件转换成XML文档,然后用Xpath查找HTML节点或元素。一、HTML与XML二、XPath1、XPath路径表达式三、Lxml库html=etree.HTML(text)#将字符串转换成HTML格式#print(etree.tostring(html))#补全HTMLres......
  • MongoDB基础操作
    目录一、什么是MongoDB二、MongoDB与关系型数据库对比三、数据类型四、部署MongoDB1、下载二进制包2、下载安装包并解压3、创建用于存放数据和日志的目录,并修改权限4、启动MongoDB4.1前台启动4.2后台启动4.3、配置文件启动服务4.4、配置systemd服务4.5、systemctl启动MongoDB5、......
  • 鸿蒙系统应用基础开发
    0x01概要叙述(1)鸿蒙系统鸿蒙是华为公司开发的操作系统,在多端使用以手机为中心,包括手表、平板等“万物互联”思想各类应用间接为用户带来操作系统的用途“鸿蒙应用千帆起,轻舟已过万重山”(2)准备工作a.语言鸿蒙系统应用的开发语言:ArkTS是TypeScript的超集......
  • 不只有 Spring,这四款 Java 基础开发框架同样值得关注! 审核中
    Java开发不只有Spring,今天给大家推荐几个同样优秀的Java基础开发框架,为日常项目开发提供更多的选择。答应我,请不要再叫我Spring小子了,​好吗?项目概览:Guice:轻量级依赖注入框架Javalin:轻量级Java和KotlinWeb框架Quarkus:云原生时代高性能Java框架Vert.x:构建响应......
  • WPF 基础绘图 创建和加工图片
    本文将从控制台开始,告诉大家一个非常简单的WPF基础绘图方法,通过本文的方法可以调用WPF上层人类友好的方法,充分利用GPU资源,创建或加工图片,最终结果可以输出到本地文件,可支持编码出多种不同的图片格式本文仅用到WPF的多媒体渲染层,在WPF的这一层上的API是人类友好的,直接......
  • UNO 新建基础库项目构建提示 UNOB0002 错误
    当咱新建了一个UNO的基础库或被引用的项目时,可能采用的是默认的基础库或库项目创建方法,被引用的程序集没有带上WinUI的黑科技,导致构建提示UNOB0002:ProjectXXcontainsareferencetoUnoPlatformbutdoesnotcontainaWinAppSDKcompatibletargetframework.失败......
  • MinIO 常用 API 快速入门
    快速入门minio中文网minio官网minio有开源版和收费版,使用开源版时,若修改了minio的源代码,需要将修改后的源代码完全公开。启动miniominio文档提供了多个运行环境的安装流程,此处以windows为例,其它运行环境文档上都有介绍。相关文档下载minio.exe:https://dl.minio......
  • [笔记]html+css基础知识
    1.html标签单标签<br/>:换行用<meta/>:存字符编码,作者,版权,关键字,网页说明等信息,不显示在浏览器中a.比如:<metahttp-equiv="Content-Type"content="text/html;charset=gb2312"/><hr/>:插入一条水平线,两个标签表示插入两条<img/>:插入图片a.src是图像存储url或名......
  • 计算机基础知识
    计算机基础知识导航目录计算机基础知识导航一、数的转换进位计数制系统基本概念R进制-->十进制十进制-->R进制数据的储存单位二进制的算术运算二进制的逻辑运算二、数据的表示机器数三、计算机的基本组成运算器控制器基本概念指令、寻址方式指令寻址方式流水线流水线多级存储结......
  • 以链表作为基础实现栈空间(链式栈)
    数据结构以链表作为基础实现栈空间(链式栈)/****************************************************************************************************************** * filename : LinkedStack.c* author : [email protected]* data : 2024/04/25* function : 链式栈......