【Python】从爬虫小白到牢饭大佬

时间：2025-01-14 21:59:29浏览次数：3

标签：小白到浏览器请求 Python 牢饭元素 HTML 标签属性

也许在某一个平行时空里，我们美好地相遇，白头偕老；也可能在另一个平行时空里，我们在人海中无数次擦身而过，素昧平生；只可惜在这个时空里，你的名字叫遗憾。

爬虫简介

1. 网络爬虫，是一种按照一定的规定，自动抓取互联网信息的程序或者脚本。

2. 爬虫运行原理：先获取数据，再处理数据，最后存储数据。

网页简介

1. 网址，又称统一资源定位符(URL)，用于标识资源在网络上的地址。

2. 一个网址通常由：网络协议类型、域名、资源在服务器中的位置组成。

3. 网址内有时还存在锚点，#...，用于快速定位页面内容。

浏览器上网原理

1. 用户向浏览器输入网址。

2. 浏览器根据我们的网址，找到对应域名的服务器，向服务器发送请求获取资源。

3. 服务器收到请求后做出响应，把资源交给浏览器。

4. 浏览器加载资源并呈现给用户。

开发者工具

1. 推荐使用谷歌浏览器，Ctrl+shift+I，打开开发者工具。

Elements面板

Network面板

1. Network面板记录了发生在该页面的所有请求---响应。

2. Network面板主要关注：功能区、筛选区、请求列表区。

3. 功能区主要关注：clear(清除)、Preserve log(保留请求记录)两个功能。

4. 筛选区主要关注：All、Others等标签。

5. 请求列表区：当开发者工具捕捉到新的请求时，会成列在请求列表区。

6. 请求名：name；请求状态：status；请求类型：type。

7. 点击name，则会在右边的Headers信息区的General部分了解到：请求网址，请求方法，状态码。

响应状态码

1. 面对浏览器发送过来的请求，服务器都会做出相应，而响应状态码可以反应出本次响应的状态。

2. 如果出现客户端错误，则返回404，并且将网页跳转至： https://web.shanbay.com/codetime/home/404。

3. 可能是用户输错了 URL，也可能是开发者将资源移动到了其它位置。

HTML文档

1. 点击name，则会在右边的Response信息区了解到：服务器响应后呈现的HTML文档。

2. HTML文档，即超文本标记语言，是计算机语言的一种，用来结构化Web网页及其内容。

HTML基本语法

1. HTML文档由元素构成，元素由三部分组成：开始标签、元素内容、结束标签。

2. p元素：段落；h元素：标题；a元素：超链接。

3. 元素的属性需要在元素的开始标签中标注，写成属性名称="属性值"的形式，如果一个元素有多个属性，属性与属性之间需要用一个空格隔开。

4. href属性，即超文本引用，用于描述超链接的属性，后面跟上超链接的链接。

5. target属性，默认值为_self，表示在当前页面打开链接；还可以改成_blank，表示会在浏览器新标签页打开链接。

6. class、id属性都是用来标识元素的，class可以重复出现，而id是唯一的。

7. style属性则能够为元素设置样式。

8. HTML中用img元素来描述图片。img元素有两个特殊属性，一个是src(图片来源属性)，值是图片资源对应的URL；另一个是alt(用于替换的文本)属性，当用户无法查看图片时，浏览器会读取alt属性值，作为图片内容的替代信息展示给用户。

9. img元素只有开始标签，属于空元素；此外还有换行符br元素、水平分割线hr元素都是空元素。

10. 浏览器在解析HTML文档时，会忽略所有多余空格、换行符。

11. &nbsp字符表示空格。

12. code 元素用来描述代码。

致谢

感谢您花时间阅读这篇文章！如果您对本文有任何疑问、建议或是想要分享您的看法，请不要犹豫，在评论区留下您的宝贵意见。每一次互动都是我前进的动力，您的支持是我最大的鼓励。期待与您的交流，让我们共同成长，探索技术世界的无限可能！

标签：小白到,浏览器,请求,Python,牢饭,元素,HTML,标签,属性
From： https://blog.csdn.net/hsy1603914691/article/details/145121884

从零开始的python之旅（day3）
从零开始的python之旅（day3）越学python越觉得其功能丰富，而且相对于c语言来说，python可能更适合新手入门，两个都是相通的，看自己对哪方面感兴趣吧先让我们来对昨天作业收一下尾 BMIx=float(input('请输入体重（kg)\n'))y=float(input('请输入身高（m）\n'))bmi=float(......
Python处理Excel数据的方法，这一篇文章就够了！！
Excel是数据处理的“瑞士军刀”，在日常工作中扮演着重要角色。然而，面对复杂的Excel文件时，手动处理显然效率低下。那么，如何利用Python高效地处理Excel数据？xlrd、xlwt、openpyxl和pandas是不可或缺的利器。今天，我们就来深度剖析这些工具，教你用Python优雅地操作Excel！......
python语言A站视频爬虫程序代码QZQ1
importrequestsimportosimportsubprocess#https://ali-safety-video.acfun.cn/mediacloud/acfun/acfun_video/3fd2d78e1ebba085-529617cf38bbad5860227fbdf3a41546-hls_720p_2.00003.ts?pkey=ABC_F8k9Ed6OSnAdir8rrRmbYfeU39b5CvYeJQ3ttw8ZLQzlfk1NZNLJOlmwW-9ENIIuNL......
python语言tengxunshipin爬虫程序代码QZQ2
importrequests#找媒体的请求url即可。url=‘https://f3e3963e336d9d3bdc18adcb0240e796.v.smtcdns.com/music.qqvideo.tc.qq.com/AIRFhqAd3UEXqwLOz5sfupz_V8TD-xZxVeAZnZUXZJYg/B_JxNyiJmktHRgresXhfyMep_mLAvgwYmAjetftmCCCW-f7a09P0_-_3BS3XuKJsUR/k0012md5982.mp4......
Python 文件和异常捕获（详解）
前言：在Python编码中，我们会学到python中的文件的读取与写入，当然还有对文件夹的操作，在文章的最后还有异常捕获的详细解释~~一.文件的概念：有名称：每个文件都有一个文件名，用于在特定的文件系统中唯一标识该文件，方便用户和系统对文件进行识别、访......
Python用Lasso改进线性混合模型Linear Mixed Model分析拟南芥和小鼠复杂性状遗传机制
全文链接：https://tecdat.cn/?p=38800原文出处：拓端数据部落公众号在生物医学领域，探究可遗传性状的遗传基础是关键挑战之一。对于受多基因位点多因素控制的性状，准确检测其关联存在诸多困难，且易受群体结构等混杂因素影响产生假阳性结果。本文帮助客户建立Lasso线性混合模型，它能实现......
Python线性混合效应回归LMER分析大鼠幼崽体重数据、假设检验可视化
全文链接：https://tecdat.cn/?p=38816原文出处：拓端数据部落公众号在数据分析领域，当数据呈现出层次结构时，传统的一般线性模型（GLM）可能无法充分捕捉数据的特征。混合效应回归作为GLM的扩展，能够有效处理这类具有层次结构的数据，如聚类数据、重复测量数据和纵向数据等。本文将深入探讨......
关于python的初步学习
python中的数据类型：整数（int）：用于表示整数，例如-5，0，10等。浮点数（float）：用于表示小数，例如3.14，-0.5等。字符串（str）：用于表示文本，例如"Hello"，'World'等。布尔值（bool）：用于表示真或假，只有两个值，True和False。列表（list）：用于存储一组有序的数据，可以包含不同类型的元素，例如[1,2,3]......
【python】OpenCV—Extract Horizontal and Vertical Lines—Morphology
文章目录1、功能描述2、代码实现3、效果展示4、完整代码5、参考更多有趣的代码示例，可参考【Programming】1、功能描述基于opencv-python库，利用形态学的腐蚀和膨胀，提取图片中的水平或者竖直线条2、代码实现导入基本的库函数importnumpyasnpimportcv2as......
【python游戏】最经典的五个小游戏（完整代码）
文章目录前言案例1:猜数字游戏案例2:石头剪刀布游戏案例3:使用pygame的简单打砖块游戏案例4:井字棋（Tic-Tac-Toe）案例5:贪吃蛇游戏（使用pygame）前言当然，我可以为你提供五个简单的Python游戏案例。这些游戏涵盖了不同的难度和类型，从文本冒险到简单的图形界面游戏。......

【Python】从爬虫小白到牢饭大佬

爬虫简介

网页简介

浏览器上网原理

开发者工具

Elements面板

Network面板

响应状态码

HTML文档

HTML基本语法

致谢

相关文章

赞助商

阅读排行