首页 > 编程问答 >Starmap 与 tqdm 结合?

Starmap 与 tqdm 结合?

时间:2024-07-21 03:24:16浏览次数:8  
标签:python multiprocessing python-multiprocessing tqdm process-pool

我正在做一些并行处理,如下所示:

with mp.Pool(8) as tmpPool:
        results = tmpPool.starmap(my_function, inputs)

其中输入如下所示: [(1,0.2312),(5,0.52) ...] 即 int 和 float 的元组。

代码运行良好,但我似乎无法将其包装在加载栏(tqdm)上,例如可以使用 imap 方法来完成,如下所示:

tqdm.tqdm(mp.imap(some_function,some_inputs))

可以这也适用于星图吗?

谢谢!


是的,你可以将 starmap tqdm 结合使用以获取进度条。但是,你不能直接像 imap 那样将 starmap 传递给 tqdm 。你必须迭代可迭代对象并手动更新进度条。

以下是如何使用 starmap tqdm 实现此目标的方法:

from tqdm import tqdm
import multiprocessing as mp

def my_function(int_val, float_val):
    # 在这里放置你的函数逻辑
    # 例如:
    result = int_val * float_val
    return result

if __name__ == '__main__':
    inputs = [(1, 0.2312), (5, 0.52), (3, 0.9)]  # 示例输入
    num_processes = 8

    with mp.Pool(num_processes) as pool:
        results = list(tqdm(pool.starmap(my_function, inputs), total=len(inputs)))

    print(results)

说明:

  1. 迭代和 tqdm 我们使用 pool.starmap() 在输入元组上并行执行 my_function pool.starmap() 返回一个迭代器,我们将其传递给 tqdm 以创建进度条。
  2. total 参数: 我们向 tqdm 提供 total 参数,该参数设置为输入元组 inputs 的长度。这使进度条能够准确跟踪完成的迭代次数。
  3. list() 转换: 我们使用 list() tqdm 的输出转换为列表,这会强制立即执行所有计算。

此设置将在处理输入时显示进度条。

其他选项:

  • 你还可以探索 tqdm chunksize 参数,以通过一次性将更多工作项传递给工作进程来优化性能,从而减少开销。

请记住,并行处理的开销可能超过小型任务的收益,因此最好评估它在你的特定情况下是否提供显着的速度提升。

标签:python,multiprocessing,python-multiprocessing,tqdm,process-pool
From: 57354700

相关文章

  • Python应用程序跨子包共享的配置文件
    我正在构建一个应用程序来控制一些硬件。我在包中实现了不同类型的硬件:电机和测量设备。我的文件结构如下:name_of_my_app/__init__.pymain.pyconfig.iniCONFIG.pymotors/__init__.pyone_kind_of_motor.pymeasurement_devices/......
  • python中时间序列数据的梯度计算
    我正在尝试编写一个函数,它可以从最适合下面的线返回梯度dataframe在浏览了谷歌的几个资源之后,我仍然不确定这是如何完成的。我明白最佳拟合线的计算公式为:y=mx+b将因变量(y)设置为foos,将自变量(x)设置为DateTimeDatafram......
  • 调试用 C 编写的 Python 扩展
    我非常熟悉编写C代码,并且很擅长编写Python代码。我正在尝试学习如何用C编写可以从OSX10.15.7上的Python-3.9.X调用的模块。我已经得到了几个“helloworld”类型的示例,但是对于复杂的示例,我正在努力弄清楚如何调试我编写的C扩展。MWE:src/add.c//......
  • 具有块大小选项的 Python pandas read_sas 因索引不匹配而失败并出现值错误
    我有一个非常大的SAS文件,无法容纳在我的服务器内存中。我只需要转换为镶木地板格式的文件。为此,我使用pandas中chunksize方法的read_sas选项分块读取它。它主要是在工作/做它的工作。除此之外,一段时间后它会失败并出现以下错误。此特定SAS文件有794......
  • 使用 requests 包 python 时打开文件太多
    我正在使用Pythonrequests包向API发出大量请求。然而,在某些时候,我的程序由于“打开的文件太多”而崩溃。当我明确关闭我的会话时,我真的不知道这是怎么回事。我使用以下代码:importrequestsimportmultiprocessingimportnumpyasnps=requests.session()s.keep......
  • Python 是一种选择性解释语言吗?为什么下面的代码不起作用?
    由于程序是从上到下运行的,为什么下面的代码不执行块中的第一行就直接抛出错误?if5>2:print("TwoislessthanFive!")print("Fiveisgreaterthantwo!")错误:文件“/Users/____/Desktop/Pythonpractise/practise.py”,第3行print("五比二大!")Indentati......
  • 裁剪时间变量 Python Matplotlib Xarray
    我不确定这是否是一个愚蠢的问题,但我想按时间变量剪辑.nc文件。我在xarray中打开了数据集,但以下ds.sel行(之前已运行)仅返回错误。ds=xr.open_dataset('/Users/mia/Desktop/RMP/data/tracking/mcs_tracks_2015_11.nc')selected_days=ds.sel(time=slice('2015-11-22',......
  • 用于匹配两个数据列表中的项目的高效数据结构 - python
    我有两个列表,其中一个列表填充ID,另一个列表填充进程名称。多个进程名称可以共享一个ID。我希望能够创建一个可以使用特定ID的数据结构,然后返回与该ID关联的进程列表。我还希望能够使用特定的进程名称并返回与其连接的ID列表。我知道我可以为此创建一个字典,但是I......
  • 有人可以解决我的代码中的问题吗?而且我无法在我的电脑上安装 nsetools。如何在 python
    从nsetools导入Nseimportpandasaspdnse=Nse()all_stock_codes=nse.get_stock_codes()companies_with_low_pe=[]对于all_stock_codes中的代码:如果代码=='符号':继续尝试:stock_quote=nse.get_quote(代码)pe_ratio=stock_quote.get('priceT......
  • 将 python 脚本的 stdin 重定向到 fifo 会导致 RuntimeError: input():lost sys.stdin
    我有这个python脚本,它的作用是充当服务器,它从重定向到fifo的stdin读取命令:test.py:whileTrue:try:line=input()exceptEOFError:breakprint(f'Received:{line}')在bash中运行命令:mkfifotestfifotest.py<testfifo......