首页 > 编程语言 >python 爬虫自学要多久

python 爬虫自学要多久

时间:2022-11-24 10:06:06浏览次数:39  
标签:HTTP 入门 python 基础 爬虫 学习 Python 自学

一周或者一个月。

如果完全靠自己自学,又是从零基础开始学习Python的情况下,按照每个人的学习和理解能力的不同,我认为大致上需要半年到一年半左右的时间。

当然了,Python学习起来还是比较简单的,如果有其他编程语言经验,入门Python还是非常快的,花1-2个月左右的时间学完基础,就可以自己编写一些小的程序练练手了,5-6个月的时间就可以上手做项目了。

从一定程度上来说,一些零基础的初学者想要利用两个月的时间掌握好Python是不太可能的,学习完Python后想要应聘相对应的工作岗位,即便是选择最快的学习方式也是很难实现的,无法快速实现就业。

​自学的话,根据每个人的情况来说,学习周期是不同的,如果没有任何基础,零基础小白进行Python学习的话,需要先进行简单的Python基础知识学习,就需要三个月左右的时间,然后再进行爬虫知识的学习,少则半年左右;如果参加Python培训的话,从入门到精通,学习周期五个月就可以了,学习内容更加系统化,符合企业用人需求,选择的应用领域更广泛。

​现在之所以有这么多的小伙伴热衷于爬虫技术,无外乎是因为爬虫可以帮我们做很多事情,比如搜索引擎、采集数据、广告过滤等,以Python为例,Python爬虫可以用于数据分析,在数据抓取方面发挥巨大的作用。

  但是这并不意味着单纯掌握一门Python语言,就对爬虫技术触类旁通,要学习的知识和规范还有喜很多,包括但不仅限于HTML 知识、HTTP/HTTPS 协议的基本知识、正则表达式、数据库知识,常用抓包工具的使用、爬虫框架的使用等。而且涉及到大规模爬虫,还需要了解分布式的概念、消息队列、常用的数据结构和算法、缓存,甚至还包括机器学习的应用,大规模的系统背后都是靠很多技术来支撑的。

  零基础如何学爬虫技术?对于迷茫的初学者来说,爬虫技术起步学习阶段,最重要的就是明确学习路径,找准学习方法,唯有如此,在良好的学习习惯督促下,后期的系统学习才会事半功倍,游刃有余。

  用Python写爬虫,首先需要会Python,把基础语法搞懂,知道怎么使用函数、类和常用的数据结构如list、dict中的常用方法就算基本入门。作为入门爬虫来说,需要了解 HTTP协议的基本原理,虽然 HTTP 规范用一本书都写不完,但深入的内容可以放以后慢慢去看,理论与实践相结合后期学习才会越来越轻松

标签:HTTP,入门,python,基础,爬虫,学习,Python,自学
From: https://blog.51cto.com/u_15135810/5882536

相关文章

  • Python11-eg
    实例01(创建SQLite数据库文件)1importsqlite32#连接到SQLite数据库3#数据库文件是mrsoft.db,如果文件不存在,会自动再当前目录创建4conn=sqlite3.connect('mrsoft.db'......
  • Python爬取某个网站的图片
    最近需要将某个网站的图片爬取下来,想尽了很多办法,后来使用python的爬虫技术将其爬取出来importrequestsdefdownload_save_img(img_url,file_name):headers={......
  • 初识Python
    初识Pythonpython解释器Python解释器是一个计算机程序,用来翻译python代码,并提交给计算机执行功能:1.翻译代码到二进制2.提交给计算机运行\1.计算机只认识什么?0和1\2......
  • Python - tesserocr
    目录安装安装教程:https://cuiqingcai.com/31102.html自己在安装过程中遇到的错误:RuntimeError:TesseractlibrarynotfoundinLIBPATH:[]可以直接使用whl文件来......
  • 【爬虫】爬虫基础
    目录1.爬虫介绍2.requests模块发送get请求3.get请求携带参数4.携带请求头5.携带cookie6.发送post请求7.响应Response8.获取二进制数据9.解析解析json1.爬虫介绍......
  • Python 添加记录到有自增长ID的表,如何获取新产生的ID
    关系型数据库设计时,将ID列设为自动增长列是很普遍的方式,那么在python用insert 插入数据后如何获取由数据库产生的ID,从而获取新加的记录呢?一般的方法是在表里加一个gu......
  • python 操作Oracle 自关联表进行树结构复制算法
     最近一个项目中,用关系型表来存储树型结构,其中有一段树节点复制的算法,典型的递归运用,可作为递归算法参考练习。defCheckItem_GET_ById(self,dataid):"""......
  • python中的列表和元组
    #1.列表的格式#[数据1,数据2,数据3,···]#列表可变数据类型#列表可以存储多个数据,数据之间的逗号以英文逗号分隔#列表可以存储不同类型数据,但一般存储同一数......
  • python 读写西门子PLC例子
    client.py 存取 西门子PLC数据的客户端例子 #!/usr/bin/envpython#-*-coding:utf-8-*-#Project:pi4b_aliyuniot#File:snap_client.py#Author:Long.Xu<fa......
  • python subprocess.cal调用wkhtmltohtml中遇到的问题
    最近项目中使用了wkhtmltohtml 工具,这个工具转换pdf功能非常方便。但是在python作为命令来调用时有些要注意的地方,另外还有一些和字体相关的问题要注意。一.字体问题......