首页 > 编程语言 >关于Python爬虫使用技巧

关于Python爬虫使用技巧

时间:2023-04-17 11:15:31浏览次数:33  
标签:缩进 函数 Python 代码 爬虫 技巧 print 变量

首先,Python是一种非常流行的编程语言,拥有广泛的应用领域,例如数据分析、人工智能、Web开发等。如果您是初学者,可以开始学习基础的语法和概念,例如变量、数据类型、循环、函数等等。许多在线资源可以提供学习资料。

其次,Python拥有大量的第三方库和框架,可以帮助您提高开发效率并处理各种任务,例如NumPy和Pandas用于数据处理,Scikit-learn和TensorFlow用于机器学习,Django和Flask用于Web开发等等。您可以根据自己的需求选择适合的库和框架。

最后,了解良好的编码习惯和软件工程原则也非常重要,这可以帮助您编写可靠、可维护和可扩展的代码。例如,遵循PEP 8的代码风格指南、包管理和版本控制等等。

Python编程需要注意以下几点:

缩进是代码结构的一部分,所以要注意缩进的正确性。

Python是动态类型语言,需要注意变量类型的正确使用。

Python有许多内置函数和库,需要熟悉常用的函数和库,以及它们的用法。

Python是解释型语言,需要注意代码的效率和性能。

Python有许多自带的模块和第三方库可以使用,需要学会模块和库的使用方法。

Python语法基础

1、语法规定

python语言对缩进要求十分严格,使用空白实现缩进,一般通过4个空格表示每一级的缩进。(不建议使用Tab键)

行尾的冒号“:”表示下一行代码缩进的开始

同一层次的代码必须有相同的缩进,每一组这样的语句称为一个块

2、注释

单行注释:以#开头,只在一行中显示注释内容

多行注释:被称为成对注释,继承于C语言

3、编码

Python源码文件以UTF-8格式进行编码,所有字符串都是Unicode字符串

开发者可以为源码文件指定不同的编码

encode函数:字符转换成计算机内的字节形式

decode函数:把字节转换成能看的懂的、直观的形式

4、标识符

第一个字符必须是字母或者下划线“_”

区分大小写

Python3.x中,非ASCII标识符也是合法的

5、关键字

在Python标准库中提供了一个关键字模块:keyword module

>>> import keyword #导入名为“keyword”的内置标准库
>>> keyword.kwlist #kwlist 能够列出所有内置的关键字
['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']
>>>

常用关键字具体说明:

and:用于表达式运算中的逻辑与操作

assert:断言,用于判断变量或条件表达式的值是否为真

class:用于定义类

def:用于定义函数或方法

elif:条件语句,与 if 和 else 结合使用

except:包括捕获异常后的操作代码,与 try 和 finally 结合使用

finally:用于异常语句,出现异常后执行 finally 包含的代码块,与 try 和 except 结合使用

global:定义全局变量

import:用于导入模块,与 from 结合使用

is:判断变量是否为某个类的实例

nonlocal:用于表示标识外部作用域的变量

or:用于表达式运算,逻辑或操作

print:打印输出语句

return:用于从函数返回计算结果

while:循环语句

yield:用于从函数依次返回值

以下划线开始或者结束的标识符通常具有特殊含义

以一个下划线开始的标识符

如“_foo”:不能用 from module import * 语句导入

前面有两个下划线的标识符

如“_ _ bar”:被用来实现类的私有属性

6、声明变量

变量定义

输出变量的值

运行结果:

同时赋值两个变量

对变量a、b进行同时赋值,分别赋值为“0”,“1”,最后输出变量a、b的值,运行结果如下:

7、局部变量

局部变量只能在函数或者代码块内使用的变量,函数或者代码一旦结束运行,局部变量的生命周期也将结束。局部变量只能在被创建的函数或者代码块内有效。

8、全部变量

在函数外面定义的变量叫做全局变量,全局变量能够被不同的函数、类或文件共享使用,也可以被文件内的任何函数和外部文件访问。

9、实现输入功能

通过调用内置函数 input() 可以实现输入功能

input([prompt])

代码范例:

>>>
>>> name = input('您好,请输入您的名字:')
您好,请输入您的名字:二哥
>>> name
'二哥'
>>>

10、实现输出功能

输出的作用是显示执行的结果,主要通过 print() 函数实现。语法格式如下:

print( value,...,sep=", end='\n') #只展示了部分参数

输出参数具体说明:

value:表示要输出的信息,后面的省略号表示可以有多个输出的信息

sep:表示在多个要输出信息之间的分隔符,默认值是一个空格

end:表示在所有要输出信息之后添加的符号,默认值为换行符

在 print() 函数中可以同时使用多个字符串,在使用时用逗号“,”隔开

函数 print() 还可以打印输出整数或计算结果:

>>> print(300)
300
>>> print(100+200)
300
>>> print('100 + 200 =',100 + 200)
100 + 200 = 300
>>>

代码范例:

标签:缩进,函数,Python,代码,爬虫,技巧,print,变量
From: https://www.cnblogs.com/q-q56731526/p/17325162.html

相关文章

  • 网络安全工程师教你Kali Linux:Windows计算机攻防实战技巧
    1.背景介绍msfvenom是msfpayload和msfencode的结合体,可利用msfvenom生成木马程序,并在目标机上执行,在本地监听上线,在黑客圈子,这款工具略有名气。之前的教程内容都是关于如何生成木马并进行攻击,而本节课我们着重讲解当用户计算机受到木马攻击的危害及演示防御木马病毒实战。2.准......
  • 网络安全与Kali Linux:Nmap网络扫描高级使用技巧
    课前声明:本分享仅做学习交流,请自觉遵守法律法规!搜索:Kali与编程,学习更多网络攻防干货!下篇文章将在明天下午五点发布,敬请关注!一、背景介绍SYN扫描,原理为:(1):本地主机向目标主机发送一个SYN数据段.(这里牵扯到TCP报文结构的问题,在TCP报文中SYN标志位用来建立连接,让连接的双方......
  • Python哪种方式循环最快
    众所周知,Python不是一种执行效率较高的语言。此外在任何语言中,循环都是一种非常消耗时间的操作。假如任意一种简单的单步操作耗费的时间为1个单位,将此操作重复执行上万次,最终耗费的时间也将增长上万倍。while和for是Python中常用的两种实现循环的关键字,它们的运行效率实际上是......
  • 六大JavaScript使用小技巧
    之前写过一些关于编程的小技巧,今天已久写一些JS中用到的小技巧,非常实用,如果熟悉了实用起来相当快捷方便。1.类型强制转换1.1string强制转换为数字可以用*1来转化为数字(实际上是调用.valueOf方法)然后使用Number.isNaN来判断是否为NaN,或者使用a!==a来判断是否为NaN,因为......
  • python3-list
    1、介绍builtins.py文件中定义了list类,用于处理python中列表数据。list也是python的基本数据类型之一。列表是单列的元素集合,用[]包围,内部元素之间用,分隔列表的元素可以是任意类型,且某一列表中可以同时包含不同类型列表支持元素的增删改列表支持数值索引元素不会进行默认......
  • python3-tuple
    1、介绍builtins.py文件中定义了tuple类,用于处理python中元组数据。tuple也是python的基本数据类型之一。元组是单列的元素集合,用()包围,内部元素之间用,分隔元组的元素可以是任意类型,且某一元组中可以同时包含不同类型元组定义后不支持对容量和元素的修改元组支持数值索引......
  • python3-set
    1、介绍builtins.py文件中定义了set类,用于处理python中集合数据。set也是python的基本数据类型之一。集合是单列的元素集合,用{}包围,内部元素之间用,分隔集合的元素可以是任意类型,且某一集合中可以同时包含不同类型集合定义后可以进行增删改集合不支持数值索引set是无序集......
  • python3-dict
    1、介绍builtins.py文件中定义了dict类,用于处理python中字典数据。list也是python的基本数据类型之一。2、类classdict(object):def__init__(self,seq=None,**kwargs):pass3、字面量初始化键必须是number、str和tuple这几种不可变类型,值可以是任意类型......
  • python3-range
    1、介绍range是一个类,用于帮助for循环。2、类classrange(object):"""range(stop)->rangeobjectrange(start,stop[,step])->rangeobject"""def__init__(self,stop):pass3、使用(1)一个参数foriinrange(3):#遍历0,......
  • python3-open
    1、介绍python3中,可以通过内建模块的open函数,进行文件的读写,以及创建文件。2、函数open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)file:必需,文件路径(相对或者绝对路径)。mode:可选,文件打开模式buffering:设......