首页 > 编程语言 >python3 生成器表达式

python3 生成器表达式

时间:2023-05-01 20:45:18浏览次数:46  
标签:生成器 列表 range python3 使用 gen 表达式

在 Python3 中,生成器表达式是一种语言结构,它可以快速地创建一个可迭代对象。生成器表达式类似于列表推导式,但使用圆括号而不是方括号,并且返回的是一个生成器对象而不是一个列表。

在 Python3 中,生成器表达式有两种类型:生成器函数和生成器表达式。

  1. 生成器函数:

生成器函数是一种特殊的函数,在函数中使用 yield 语句来生成一个值,然后暂停函数执行并保留当前状态,等待下一次调用时继续执行。生成器函数的优点是可以处理大量数据,因为它们只需要在内存中保存一个值,而不是全部保存在内存中。

例如,以下是一个生成器函数,它可以生成斐波那契数列中的前 n 个数字:

def fibonacci(n):
    a, b = 0, 1
    for i in range(n):
        yield a
        a, b = b, a + b
  1. 生成器表达式:

生成器表达式是使用圆括号包围的表达式,其中包含一个 for 循环和一个可选的 if 条件。生成器表达式可以用来生成一个序列,这个序列可以通过迭代访问,但不必事先将所有元素保存在内存中。

例如,以下生成器表达式可以生成一个包含从 1 到 10 的偶数的生成器对象:

gen = (i for i in range(1, 11) if i % 2 == 0)

注意事项:

  1. 生成器表达式可以节省内存空间,但是如果需要多次使用生成器对象中的值,则需要将其转换为列表或其他数据结构。
  2. 如果生成器表达式中的代码太长或复杂,则建议使用生成器函数来代替,以提高代码的可读性和可维护性。
  3. 如果生成器表达式中的代码有副作用(例如修改了全局变量),则可能会导致意外行为,应该避免这种情况。
  4. 生成器表达式可以嵌套,但是应该注意不要嵌套过深导致代码难以理解。例如:
    gen = ((i, j) for i in range(1, 4) for j in range(4, 7))

    这个生成器表达式可以生成一个包含所有 (1,4) 到 (3,6) 的元组的生成器对象。

  5. 生成器表达式中的 for 循环可以有多个,每个循环可以使用一个 if 条件。例如:
    gen = (i * j for i in range(1, 4) if i % 2 == 0 for j in range(4, 7) if j % 2 != 0)

    这个生成器表达式可以生成一个包含所有偶数 i 与奇数 j 的乘积的生成器对象。

  6. 生成器表达式中的变量作用域只在生成器表达式内部,不会泄露到外部。例如:
    x = 10
    gen = (x for x in range(1, 5))
    print(list(gen))    # 输出 [1, 2, 3, 4]
    print(x)    # 输出 10,说明 x 只在生成器表达式内部存在,不会影响外部变量 x 的值。
  7. 生成器表达式可以和其他 Python 的内置函数或模块一起使用,例如 map、filter、itertools 等。例如:
    import itertools
    
    # 使用 map 函数和生成器表达式生成一个列表,其中每个元素都是平方数。
    lst = list(map(lambda x: x ** 2, (i for i in range(1, 5))))
    print(lst)    # 输出 [1, 4, 9, 16]
    
    # 使用 itertools 模块中的 zip_longest 函数和生成器表达式生成一个包含所有输入迭代器的元组的列表。
    lst = list(itertools.zip_longest((i for i in range(1, 5)), ('a', 'b', 'c')))
    print(lst)    # 输出 [(1, 'a'), (2, 'b'), (3, 'c'), (4, None)]
  8. 在使用生成器表达式时,应该尽可能地使用惰性求值,即只生成需要的元素,并且在使用完之后立即释放相应的资源。这样可以避免不必要的内存占用和性能问题。
  9. 处理大型数据集,例如从文件或数据库中读取数据,并将其用作生成器表达式的输入。这样可以避免一次性加载所有数据,并且节省内存空间。
    with open('data.txt') as f:
        gen = (line.strip() for line in f if 'error' in line)
        for item in gen:
            print(item)
  10. 通过生成器表达式实现惰性求值,例如只有当需要时才计算函数的值。这样可以避免不必要的计算和内存占用。
    def expensive_function(n):
        print(f"Calculating {n}...")
        return n ** 2
    
    gen = (expensive_function(i) for i in range(5))
    print(list(gen))    # 输出 Calculating 0... Calculating 1... Calculating 2... Calculating 3... Calculating 4... [0, 1, 4, 9, 16]

    这个例子中,我们定义了一个函数 expensive_function,并使用一个生成器表达式来生成一个包含前五个数字的平方的列表。在评估生成器表达式时,expensive_function 只有在需要计算平方时才被调用,这样可以避免不必要的计算和内存占用。

  11. 在多个迭代器之间生成元素,例如合并两个排序列表并返回一个新的排序列表。
    def merge_sorted(lst1, lst2):
        i, j = 0, 0
        while i < len(lst1) and j < len(lst2):
            if lst1[i] <= lst2[j]:
                yield lst1[i]
                i += 1
            else:
                yield lst2[j]
                j += 1
        yield from lst1[i:]
        yield from lst2[j:]
    
    lst1 = [1, 3, 5, 7]
    lst2 = [2, 4, 6, 8]
    gen = merge_sorted(lst1, lst2)
    print(list(gen))    # 输出 [1, 2, 3, 4, 5, 6, 7, 8]

    这个例子中,我们定义了一个 merge_sorted 函数来合并两个排序列表,并返回一个新的排序列表。在函数中,我们使用一个生成器函数来生成所有排好序的元素,并在函数返回之前返回它们。这个方法可以在处理大型数据集时节省内存空间,并且可以避免不必要的排序或其他操作。

  12. 用于过滤和转换数据,例如将一个列表中的所有元素转换为字符串并删除其中的空格。
    lst = [' hello ', ' world', '', 'python', '']
    gen = (s.strip() for s in lst if s)
    print(list(gen))    # 输出 ['hello', 'world', 'python']

    这个例子中,我们使用一个生成器表达式来对列表中的所有元素进行过滤和转换。具体来说,我们首先使用 if 子句来过滤出所有不为空的字符串,然后使用 strip 方法来删除每个字符串的前导和尾随空格。最后,我们将经过处理的字符串返回为一个生成器对象,并将其转换为一个列表。

  13. 生成器表达式可以与其他 Python 内置函数(如 map 和 filter)和模块(如 itertools)结合使用,以实现更高效和优雅的代码。

  14. 在使用生成器表达式时,应该尽可能地使用惰性求值,即只生成需要的元素,并在使用完之后立即释放相应的资源。这样可以避免不必要的内存占用和性能问题。

  15. 如果生成器表达式中的代码有副作用(例如修改了全局变量),则可能会导致意外行为,应该避免这种情况。

  16. 在编写长的生成器表达式时,建议将其分解成多个简单的表达式或生成器函数,以提高代码的可读性和可维护性。

  17. 在使用生成器表达式时,应该学会使用列表推导式和普通的 for 循环来进行比较,以选择最适合特定任务的工具。

  18. 最后,需要注意的是,生成器表达式虽然非常强大和方便,但也并非万能的。在某些情况下,还是需要使用其他语言结构或算法来解决问题。

  19. 在使用生成器表达式时,应该避免使用过多的嵌套循环和条件语句,以免代码变得难以阅读和维护。在这种情况下,建议考虑使用其他数据结构或算法。

  20. 使用生成器表达式时,应该尽可能地保持代码简单和易读。这包括命名变量、注释代码和格式化输出,以便其他人可以理解你的代码。

  21. 在使用生成器表达式时,需要注意一些性能问题。例如,在处理大型数据集时,可能需要考虑使用并行计算或其他优化算法来提高效率。让我们来看一个例子,说明生成器表达式和列表推导式之间的差异:

让我们来看一个例子,说明生成器表达式和列表推导式之间的差异:

# 列表推导式
lst = [i ** 2 for i in range(1, 11)]
print(lst)

# 生成器表达式
gen = (i ** 2 for i in range(1, 11))
print(list(gen))

个例子中,我们首先使用列表推导式创建一个包含前 10 个数字的平方的列表。然后,我们使用一个生成器表达式来创建一个包含相同元素的生成器对象,并将其转换为一个列表。

一般来说,列表推导式比起生成器表达式更加适合小型数据集,因为它们可以在内存中完全构建出一个列表,并且可以在需要时随时进行索引和修改。另一方面,生成器表达式更适合大型数据集,因为它们只返回必要的元素,而且可以逐个处理每个元素,从而节省内存空间。

在实际编程中,我们应该根据具体情况选择最适合的工具,并权衡各种因素(例如代码的可读性、效率、内存占用等)。

标签:生成器,列表,range,python3,使用,gen,表达式
From: https://www.cnblogs.com/yund/p/17366967.html

相关文章

  • 正则表达式
     /*一:基本操作二:匹配:单字符三:匹配:多字符四:开头结尾五:匹配分组*/ 一:基本操作importreif__name__=='__main__':#匹配操作:match()result=re.match(正则表达式,要匹配的字符串)#提取数据:group()result.group()......
  • HJ89 24点运算 用递归生成器进行数列穷举
    思路:1、对4张牌进行全排序,并输出列表2、分别对排序进行计算尝试,采用穷举方式3、返回结果除了用递归生成器进行数组全排序外,也用模块fromitertools importpermutations,进行全排序。1#输出算式运算顺序从左至右运算,不需要括号确定优先级。23#列举所有排序方式,比如......
  • Centos7 安装 python3.9
    今天差点把服务器搞砖了,3.6无法满足要求,3.7一直装不上。重装之前遇到这篇文章,搞定Centos7系统安装Python3.9图文教程......
  • springboot mybatis-plus 3.5.1代码生成器配置
    springbootmybatis-plus3.5.1代码生成器配置https://blog.csdn.net/Lean_on_Me/article/details/128066822  ......
  • python3 环境搭建
    安装Python3:从官网https://www.python.org/downloads/下载符合您操作系统的Python3版本,并按照安装向导完成安装。配置环境变量:将Python3的安装路径添加到系统PATH环境变量中。在Windows系统中,可以右键点击“此电脑”,选择“属性”->“高级系统设置”->“环境变量”,在系......
  • 常用的正则表达式
    开发过程中中常用正则式身份证弱校验:15位或18位,最后一位为校验位可能为数字或字符X(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)手机号^(13[0-9]|14[01456879]|15[0-35-9]|16[2567]|17[0-8]|18[0-9]|19[0-35-9])\d{8}$ipv4地址((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})(\.......
  • java-正则表达式判断手机号
    要更加准确的匹配手机号码只匹配11位数字是不够的,比如说就没有以144开始的号码段,故先要整清楚现在已经开放了多少个号码段,国家号码段分配如下:移动:134、135、136、137、138、139、150、151、157(TD)、158、159、187、188联通:130、131、132、152、155、156、185、186......
  • Windows安装Python3
    1、Python安装Python是跨平台的编程语言,它可以运行在windowS、Mac和各种Linux/Unix系统上。也就是说,假设在windows系统下编写的Python程序,在Mac或Linux系统下也是可以运行的。目前,Python的版本主要分为两大类,即Python3.X版和Python2.x版,这两个版本是不兼容的。由于Python3.x......
  • 正则表达式引发的惨痛代价
    关注Java后端技术栈“回复“面试”获取最新资料案例在一次小型项目开发中,我遇到过这样一个问题。为了宣传新品,我们开发了一个小程序,按照之前评估的访问量,这次活动预计参与用户量30W+,TPS(每秒事务处理量)最高3000左右。这个结果来自我对接口做的微基准性能测试。我习惯使用ab工具......
  • 生成器;迭代生成器
     附:1、生成器的使用。list(生成器),next(生成器),不同方式获取生成器不同数值。 2、send()改变生成器的参数 3、yeild和return的不同 用return报错,StopIterationtryexcept,异常捕捉相当于ifelse 4、tryexcept:异常捕捉 ......