首页 > 编程语言 >Python 初学者容易踩的 5 个坑

Python 初学者容易踩的 5 个坑

时间:2024-03-11 19:12:48浏览次数:36  
标签:bitecode Python 列表 初学者 print 容易 元组 numbers woops

哈喽大家好,我是咸鱼。

今天咸鱼列出了一些大家在初学 Python 的时候容易踩的一些坑,看看你有没有中招过。

原文:https://www.bitecode.dev/p/unexpected-python-traps-for-beginners

不明显的字符串拼接

Python 在词法分析的时候会把多个字符串自动拼接起来。

data = "very""lazy"
print(data) # verylazy

这个特性可以让我们在声明一个长字符串的时候可以分成多行来写,这样看起来比较优雅。

msg = (
    "I want this to be on a single line when it prints " 
    "but I want it to be broken into several lines in "
    "the code"
    )


print(msg)
# I want this to be on a single line when it prints but I want it to be broken into several lines in the code
msg ="I want this to be on a single line when it prints " \
    "but I want it to be broken into several lines in " \
    "the code"

print(msg)
# I want this to be on a single line when it prints but I want it to be broken into several lines in the code

但初学者往往会忽略这一点,他们在使用包含字符串的列表时把分隔符漏掉,造成了意想不到的字符串拼接。

比如说他们想要声明一个包含域名的列表host。

host = [
    "localhost",
    "bitecode.dev",
    "www.bitecode.dev"
]

print(host) # ['localhost', 'bitecode.dev', 'www.bitecode.dev']

但是写成了下面这样。

host = [
    "localhost",
    "127.0.0.1",
    "bitecode.dev" # 这里把逗号忘掉了
    "www.bitecode.dev"
]

print(host) # ['localhost', 'bitecode.devwww.bitecode.dev']

这是有效的代码,不会触发语法错误,但是解析的时候会把 "bitecode.dev""www.bitecode.dev" 拼接在一起,变成 'bitecode.devwww.bitecode.dev'

sorted() 和 .sort() 傻傻分不清

在 Python 中,大多数函数或方法都会返回一个值。比如说我们要对一个列表里面的内容进行排序,可以使用 sorted() 方法。

# sorted() 方法会返回一个排序后的新列表
numbers = [4, 2, 3]
sorted_numbers = sorted(numbers)
print(sorted_numbers) # [2, 3, 4]

我们也可以用列表自带的 .sort() 方法来排序,需要注意的是: .sort() 直接对原有列表进行排序,不会返回任何值。

# .sort() 方法直接对原列表进行排序
numbers = [4, 2, 3]
numbers.sort()
print(numbers) # [2, 3, 4]

但是初学者很容易把 sorted() 的用法用在 .sort() 上,结果发现怎么返回了一个 None。

numbers = [4, 2, 3]
sorted_numbers = numbers.sort()
print(sorted_numbers) # None

list.sort() 修改原列表,它不会返回任何内容。当 Python 可调用对象不返回任何内容时,会得到 None

或者把 .sort() 的用法用在了 sorted() 上。

numbers = [4, 2, 3]
sorted(numbers)
print(numbers) # [4, 2, 3]

不要乱加尾随逗号

我们在创建一个空元组的时候可以用下面的两种方法:

t1 = ()
t2 = tuple()
print(type(t1))
print(type(t2))

在 Python 中,虽然元组通常都是使用一对小括号将元素包围起来的,但是小括号不是必须的,只要将各元素用逗号隔开,Python 就会将其视为元组。

t1 = 1,
print(t1) # (1,)
print(type(t1)) # <class 'tuple'>

所以如果在数据后面多加了一个逗号,就会产生一些问题。

比如说下面是一个列表:

colors = [
    'red',
    'blue',
    'green',
]
print(colors) # ['red', 'blue', 'green']

如果不小心加了一个尾随逗号,列表就变成了元组。

colors = [
    'red',
    'blue',
    'green',
],
print(colors) # (['red', 'blue', 'green'],)

在 python 中,包含一个元素的元组必须有逗号,比如下面是包含一个列表的元组:

colors = [
    'red',
    'blue',
    'green',
],

这是列表:

colors = ([
    'red',
    'blue',
    'green',
])

可怕的 is

在 python 中, is 和 == 都是用来比较 python 对象的,区别是:

  • is 比较需要对象的值和内存地址都相等
  • == 比较只需要对象的值相等就行了

事实上,这两者的实际使用要远远复杂的多。

比如说下面的 a 和 b 是两个不同的对象,a is b 应该返回 False,但是却返回了 True。

a = 4
b = 4

print(a == b) # True
print(a is b) # True

在 python 中,由于小整数池和缓存机制,使用 is 来比较对象往往会出现意想不到的结果。

关于小整数池和缓存机制可以看我这篇文章:

《Python 中 is 和 == 的区别》

奇怪的引用

在Python中,如果 * 运算符用于数字与非数字型数据(列表、字符串、元组等)的结合,它将重复非数字型数据。

print("0" * 3) # '000'
print((0,) * 3) # (0, 0, 0)

在创建一个多个列表元素的元组时候,如果使用下面的代码:

t1 = ([0],) * 3
print(t1) # ([0], [0], [0])

会带来意想不到的问题:我们对元组中的第一个列表元素中的数据进行算数运算(自增 1)

t1[0][0] += 1
print(t1) # ([1], [1], [1])

我们发现元组中的所有列表元素内的数据都自增 1 了,我们不是只对第一个列表元素进行自增的吗?

实际上,当我们执行 t1 = ([0],) * 3 的时候,不会创建一个包含三个列表组成的元组,而是创建一个包含 3 个 引用的元组,每个引用都指向同一个列表。

元组中的每个元素都是对同一个可变对象(列表)的引用,所以当我们修改其中的元素时,另外的对象也会跟着发生变化。

正确的方法应该是:

t2 = ([0], [0], [0])  
# 或者 t2 = tuple([0] for _ in range(3))
t2[0][0] += 1             
print(t2) # ([1], [0], [0]) 

在 python 的其他地方中也有这种类似的坑:

def a_bugged_function(reused_list=[]):  
    reused_list.append("woops")         
    return reused_list                  
                                        
print(a_bugged_function())  # ['woops']            
print(a_bugged_function())  # ['woops', 'woops']            
print(a_bugged_function())  # ['woops', 'woops', 'woops']          

可以看到,reused_list 在函数定义中被初始化为一个空列表 [],然后每次函数调用时都使用这个默认的空列表。

在第一次调用 a_bugged_function() 后,列表变成了 ['woops']。然后,在第二次和第三次调用中,它分别继续被修改,导致输出的结果为:

['woops']
['woops', 'woops']
['woops', 'woops', 'woops']

这是因为在函数定义中,如果将可变对象(例如列表)作为默认参数,会导致该对象在函数调用时被共享和修改:每次调用函数时,使用的都是同一个列表对象的引用。

为了避免这种情况,常见的做法是使用不可变对象(如 None)作为默认值,并在函数内部根据需要创建新的可变对象。

def a_fixed_function(reused_list=None):
    if reused_list is None:
        reused_list = []
    reused_list.append("woops")
    return reused_list

print(a_fixed_function())
print(a_fixed_function())
print(a_fixed_function())

标签:bitecode,Python,列表,初学者,print,容易,元组,numbers,woops
From: https://www.cnblogs.com/edisonfish/p/18066829

相关文章

  • 【Python使用】python高级进阶知识md总结第3篇:静态Web服务器-返回指定页面数据,静态We
    python高级进阶全知识知识笔记总结完整教程(附代码资料)主要内容讲述:操作系统,虚拟机软件,Ubuntu操作系统,Linux内核及发行版,查看目录命令,切换目录命令,绝对路径和相对路径,创建、删除文件及目录命令,复制、移动文件及目录命令,终端命令格式的组成,查看命令帮助。HTTP请求报文,HTTP响应报文......
  • python爬虫scrapy之如何同时执行多个scrapy爬行任务
    来源:https://www.shanhubei.com/archives/23601.html1、顺序执行:fromscrapy.cmdlineimportexecuteexecute(['scrapy','crawl','httpbin'])2、同时进行setting=get_project_settings()process=CrawlerProcess(setting)didntWo......
  • Python实现企业微信自动打卡程序二:跳过节假日,随机打卡时间,定时任务,失败通知
    一、介绍在上节Python实现企业微信上下班自动打卡程序内容之后,我们继续优化自动打卡程序。接下来增加如下内容:实现打卡时间随机范围处理节假日不打卡的情况实现定时调度打卡打卡成功或失败通知自己二、实现打卡时间随机范围既然我们程序写完后需要定时执行,那定时执行打......
  • Logstash接收udp/tcp数据 python+ udp/tcp +logstash +elasticsearch
    Logstash接收udp/tcp数据背景:在 Logstash数据源为日志文件操作 基础上进行一、配置文件1.D:\usr\local\etc\logstash\pipeline1目录下logstash.conf文件配置input{stdin{}udp{host=>"0.0.0.0"#从5000端口获取日志port=>5000......
  • C# 启动 Python 不能及时获取输出信息
    结论:在print函数前加上sys.stdout.flush()。有的说加载print之后,都可以试试。fromtimeimportsleepimportsysif__name__=="__main__":sys.stdout.flush()print("Start")foriinrange(10000):#sys.stdout.write(str(i))sys.stdo......
  • python的一些设置
    一1全局设置pip加速。查找pip.ini文件,添加以下代码[global]index-url=http://pypi.tuna.tsinghua.edu.cn/simple/[install]trusted-host=pypi.tuna.tsinghua.edu.cn2执行poetryinstall命令单个项目:pyproject.toml文件加入以下内容可以加速[[tool.poetry.sourc......
  • Python - PyCharm支持的4种Python Interpreter和配置方法
    原文地址https://blog.csdn.net/qq_41498261/article/details/109112331 1.VirtualenvEnvironment1.1VirtualenvEnvironment是什么?1.2如何使用VirtualenvEnvironment?1.2.1.Newenvironment1.2.2.Existingenvironment2.CondaEnvironment2.1CondaEnvironment是什么......
  • python 有关于四舍五入,四舍六入的内容
    一、简介二、内容三、问题 一、简介最近看书看到了,有关python 内置的函数round取小数点的问题。书上描述的是四舍五入,然后又说,‘四舍五入’只是个约定的说法,并非所有的.5都会被进位。然后我再上网查了下,才知道,之前使用的四舍五入后面,还有个四舍六入五成双......
  • linux 通过python 命令定时删除文件,不通过crontab
    importosimporttimelog_dir="/var/log/"defdelete_expired_logs():current_time=time.localtime()print(current_time.tm_hour)ifcurrent_time.tm_hour==12andcurrent_time.tm_min==30:print('xxxxxxxxxx')......
  • python json格式转url参数&分割, url参数转json格式
    前言全局说明一、json格式转url参数&分割>>>fromurllib.parseimporturlencode>>>params={'user':'admin','pwd':'123456'}>>>print(urlencode(params))二、url参数转json格式>>>importj......