无法正确使用“comm.Gatherv()”来收集大小不均匀的 numpy 数组

时间：2024-07-24 06:46:55浏览次数：14

标签：python numpy mpi mpi4py

我正在学习 MPI4Py，我想实现一个简单的程序。

解释
这里，每个等级都有一个 send_array 大小 rank+1 和值分别等于 rank+1

rank0 = [1]
rank1 = [2 2]
rank2 = [3 3 3]
rank3 = [4 4 4 4]

我想收集值 rank=0 到缓冲区 rbuf 它的大小等于所有本地 send_arrays 的总大小，即 1+2+3+4 = 10

程序

from mpi4py import MPI
import numpy as np

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

send_array = np.ones(rank+1).astype(int) * (rank + 1)

print(rank, send_array)
if rank == 0:
    gather_size = np.array([sum([i+1 for i in range(size)])])
    print(gather_size)

    rbuf = np.zeros(gather_size[0]).astype(int)
else:
    gather_size = None
    rbuf = None

# comm.Gatherv(sendbuf, recvbuf=(recvbuf, recvcounts, displs, datatype), root=0)
comm.Gatherv(sendbuf=send_array, recvbuf=(rbuf, (1,2,3,4),(0,1,3,6), MPI.INT), root=0)

 
if rank == 0:
    print(rbuf, len(rbuf))

观察/错误/怀疑

我手动将这些值硬编码为更明确，因为我有疑问关于 recvcounts 和 displs 的值。我收到以下错误：

comm.Gatherv(sendbuf=send_array, recvbuf=(rbuf, (1,2,3,4),(0,1,3,6), MPI.INT), root=0)
  File "mpi4py/MPI/Comm.pyx", line 724, in mpi4py.MPI.Comm.Gatherv
mpi4py.MPI.Exception: MPI_ERR_TRUNCATE: message truncated

我期望的结果是：

[1 2 2 3 3 3 4 4 4 4]

玩了一下之后，我还意识到代码有效如果我保持 rbuf 的大小等于 [| ||]，在本例中可能是 maximum_local_array_size*number_of_ranks ，因为我有 4 个等级。 4*4 我得到的结果不是我想要的，但我没有收到任何错误。请注意，这次我也没有指定

from mpi4py import MPI
import numpy as np

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

# send_array = np.ones(10).astype(int) * (rank + 1)
send_array = np.ones(rank+1).astype(int) * (rank + 1)

print(rank, send_array)
if rank == 0:
    gather_size = np.array([16])
    print(gather_size)

    rbuf = np.zeros(gather_size[0]).astype(int)
else:
    gather_size = None
    rbuf = None

# comm.Gatherv(sendbuf, recvbuf=(recvbuf, recvcounts, displs, datatype), root=0)
comm.Gatherv(sendbuf=send_array, recvbuf=(rbuf, MPI.INT), root=0)
 
if rank == 0:
    print(rbuf, len(rbuf))

和 recvcounts 所以我不确定这些参数默认使用的确切值是什么，因为这些值似乎有效。 displs . So I am not sure what exact values are used by default for these arguments, since those seem to work.

[1 0 0 0 2 2 0 0 3 3 3 0 4 4 4 4]

你的 recvcounts 和 displs 参数的理解是正确的。但是，你遇到的问题在于 Gatherv 操作如何将数据放入接收缓冲区（ rbuf ）。

在你的代码中，你正确地计算了 recvcounts 为 (1, 2, 3, 4) ， displs 为 (0, 1, 3, 6) 。这意味着：

进程 0 发送 1 个元素，这些元素应该放在 rbuf 的索引 0 处开始。
进程 1 发送 2 个元素，这些元素应该放在 rbuf 的索引 1 处开始。
进程 2 发送 3 个元素，这些元素应该放在 rbuf 的索引 3 处开始。
进程 3 发送 4 个元素，这些元素应该放在 rbuf 的索引 6 处开始。

问题在于，当你使用 recvcounts 和 displs 时， Gatherv 不会将接收到的数据视为一个连续的数组。相反，它将接收到的数据视为多个块，每个块都由 recvcounts 和 displs 指定。

因此，当你在进程 0 上打印 rbuf 时，你会看到：

[1 0 0 0 2 2 0 0 3 3 3 0 4 4 4 4]

这是因为 Gatherv 按以下方式填充了 rbuf ：

来自进程 0 的 [1] 被放置在索引 0 处。
来自进程 1 的 [2 2] 被放置在索引 1 处开始。
来自进程 2 的 [3 3 3] 被放置在索引 3 处开始。
来自进程 3 的 [4 4 4 4] 被放置在索引 6 处开始。

rbuf 中剩余的零值是未初始化的内存。

为了获得你期望的结果 [1 2 2 3 3 3 4 4 4 4] ，你需要在执行 Gatherv 之后将接收到的数据块复制到一个新的数组中：

from mpi4py import MPI
import numpy as np

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

send_array = np.ones(rank + 1).astype(int) * (rank + 1)

print(rank, send_array)

if rank == 0:
    gather_size = np.array([sum([i + 1 for i in range(size)])])
    print(gather_size)

    rbuf = np.zeros(gather_size[0]).astype(int)
else:
    gather_size = None
    rbuf = None

comm.Gatherv(sendbuf=send_array, recvbuf=(rbuf, (1, 2, 3, 4), (0, 1, 3, 6), MPI.INT), root=0)

if rank == 0:
    result = np.concatenate([rbuf[displs[i]:displs[i] + recvcounts[i]] for i in range(size)])
    print(result, len(result))

这段代码将创建一个新的 result 数组，并将接收到的数据块从 rbuf 复制到 result 中，从而产生你期望的结果。

标签：python,numpy,mpi,mpi4py
From： 78785836

SQL 命令在手动运行时工作正常（SQL Developer），但在 Python 的 oracledb 模块中给出 ORA-
我正在使用OracleSQL数据库，并且我想运行该命令ALTERSESSIONSETNLS_DATE_FORMAT='YYYY-MM-DD';当我从SQLDeveloper应用程序手动运行它时，它工作正常。但是，当我使用oracledb模块从Python运行它时，出现以下错误：ErrorrunningSQLscript:ORA-00922:mi......
在pip包中分发pythonnet dll类型信息
我已经能够使用C#通过以下方式加载pythonnetdll：fromimportlib.resourcesimportpathimportsys#Assuming'my_package.lib'isthesub-packagecontainingtheDLLswithpath('pyrp.lib','')aslib_path:sys.path.append......
尝试使用 pyinstaller 将 python 文件转换为可执行文件时出现 TypeError
稍后的目的是通过命令行向GPT4all发送问题并将答案存储在文本文档中。我想将阻止代码转换为exe，但它产生了TypeError。这是到目前为止的代码：fromgpt4allimportGPT4Allmodel=GPT4All("Meta-Llama-3-8B-Instruct.Q4_0.gguf",device='cpu')#downloads/loads......
使用 Python-PlexAPI 获取 plex 上所有好友的关注列表
有关如何接收我的plex服务器上所有用户的监视列表的任何提示。我正在根据一些规则创建自动删除，其中一个规则是，如果电影位于用户观看列表中，则不应删除该电影。我遇到了麻烦，因为所有与观看列表相关的内容都在MyPlexAccount上。lexapi.myplex.MyPlexAccount具有我的用......
如何在 Python 中查看与 Azure OpenAI 助手关联的所有上传文件？
我正在使用Python对文档中的问题进行基准测试，并在jupyter笔记本中实例化了我的助手。我想确认助手是否有我上传的文件，但似乎找不到有关此功能将使用什么功能的文档。使用适用于AzureOpenAI的最新版本的PythonAPI。目前，无法使用AzureOpenAI的PythonAPI直接查看......
创建具有标量特征和 N 维坐标向量特征的机器学习 Numpy 数组
我正在尝试为ML程序格式化我的数据。有33,000个事件，每个事件有3个我想考虑的东西：质量、能量、坐标。质量的形状为(33000,)，看起来像：[188.9189.0125.7...127.4201.0210.1]。能量也是(33000,)并且看起来相同：[123...8910]。然后，我还有一个形状为(33000,......
如何在Python中计算小数？
我正在创建一个计算器来用python计算企业的利润，但到目前为止我只能使用整数。这是我的代码示例：Gross=int(input("PleaseentertotalGrossRevenuefortheFiscalYear"))NetTaxes=int(Gross)*0.1所以我将会计年度的总收入乘以按“税率”计算，但我只能使用......
Numpy：将掩码应用于值，然后取平均值，但并行
我有一个1dnumpy值数组：v=np.array([0,1,4,0,5])此外，我有一个2dnumpy布尔掩码数组（在生产中，有数百万个掩码）：m=np.array([[True,True,False,False,False],[True,False,True,False,True],[True,True,True,True,True],])我想将......
如何使用 Python 打开 Google Firestore 上的特定数据库？
我正在使用Firebase并使用以下代码从Firestore设置/检索文档：importfirebase_adminfromfirebase_adminimportcredentials,firestorecred=credentials.ApplicationDefault()firebase_admin.initialize_app(cred,options={"projectId":"huq-jimbo"})fires......
如何使用 Python 和 Numpy 重现 Matlab 文件读取以解码 .dat 文件？
我有一个Matlab脚本，可以读取编码的.dat文件，对其进行解码并保存。我试图使用numpy将其转换为Python。我发现对于同一个文件，我得到不同的输出结果（python数字没有意义）。该代码最初作为从串行端口读取的脚本的一部分运行，因此是数据的结构。我首先认为位移是问题所在，因为......

无法正确使用“comm.Gatherv()”来收集大小不均匀的 numpy 数组

相关文章

赞助商

阅读排行