CUDA--内存访问越界或无效的索引操作解决办法

时间：2024-08-10 20:23:58浏览次数：18

标签：LAUNCH -- ids 越界索引 CUDA BLOCKING 输入

报错信息

File "D:\anaconda3\envs\HCAVE2\lib\site-packages\torch\nn\utils\rnn.py", line 258, in pack_padded_sequence sorted_indices = sorted_indices.to(input.device) RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1. Compile with TORCH_USE_CUDA_DSA to enable device-side assertions.

解决方法

这个错误消息表明在运行CUDA代码时触发了设备端的断言错误。这通常是由于内存访问越界或无效的索引操作引起的。在上面的情况中，错误可能出现在使用pack_padded_sequence时，由于输入的长度或索引超出了预期范围，导致了CUDA断言失败。

要解决这个问题，可以尝试以下步骤：

1. 检查输入数据的长度和有效性：

确保输入序列的长度没有超出预期范围。
确保所有的输入张量（如c_ids, q_ids等）的索引值都在合法范围内。例如，输入的单词ID应在词汇表的范围内。

2. 启用CUDA的同步错误报告（CUDA_LAUNCH_BLOCKING）：

可以在运行脚本时设置环境变量CUDA_LAUNCH_BLOCKING=1，这样CUDA会同步执行命令，有助于定位确切的错误位置。

CUDA_LAUNCH_BLOCKING=1 python translate.py --data_file ...

这会让错误信息更准确地指向问题的源头。

3. 启用设备端断言：

按照错误提示，编译时可以启用设备端断言（TORCH_USE_CUDA_DSA=1），这样可以在设备端捕获更多细节的错误信息。需要注意的是，这可能需要重新编译PyTorch。

4. 排查模型中的索引操作：

仔细检查所有涉及索引操作的地方，如embedding层的调用，特别是在c_ids, q_ids等输入张量上是否有超出范围的索引。

5. 检查模型的输入顺序：

确保在使用pack_padded_sequence时，输入序列已经按长度排序，且输入的input_lengths与inputs匹配。

6. 调试小批量输入：

如果错误难以定位，可以尝试用一个很小的输入批次进行调试，逐步缩小问题的范围。

通过这些步骤，应该能够更好地理解问题的根源并进行修复。如果仍然遇到困难，建议在调试过程中逐步简化代码，查看最小化输入下是否能复现问题，并通过逐步添加复杂性来找到导致问题的具体原因。

标签：LAUNCH,--,ids,越界,索引,CUDA,BLOCKING,输入
From： https://blog.csdn.net/GDHBFTGGG/article/details/141095563

CUDA--内存访问越界或无效的索引操作解决办法--总结
设备端的断言错误（device-sideasserttriggered）通常发生在CUDA代码中访问无效的内存地址或执行了无效的操作。解决这种错误需要系统地排查代码中的潜在问题。以下是详细的解决方案：1.检查数组边界确保所有访问数组或指针的操作都在有效范围内。检查线程索引和块索引的计算，确......
js全屏，监听页面是否全屏
要检测页面是否处于全屏模式，可以使用JavaScript提供的FullscreenAPI。以下是一个简单的示例代码，演示如何检测页面是否处于全屏模式：//检测页面是否处于全屏模式functionisPageFullscreen(){return!!(document.fullscreenElement||document.mozFullScreenElemen......
Lazarus在Loongarch的loongxin mate系统不能打开对话框问题
Lazarus在Loongarch的loongxinmate系统不能使用系统的打开、保存等对话框问题。运行OpenDialog1.Execute后出现浮点数例外错误，程序自动退出。根据秋.风在在龙芯loongxinmate系统lazarus和编译的应用打开文件对话框出现卡死的临时处理方案-秋·风-博客园(cnblogs.c......
一些结论
Prufer序列Prufer序列可以将一个带标号 n 个节点的树用 [1,n]中的 n−2 个整数表示，即 n 个点的完全图的生成树与长度为 n−2 值域为 [1,n] 的数列构成的双射。Cayley定理节点个数为n的无根标号树的个数为nn-2扩展Cayley定理1n个标号节点形成一个有s颗树的......
Kubernetes-POD的健康检查
目录简介什么时候使用探针？何时使用存活探针（LivenessProbe）何时使用就绪探针（Read inessProbe）何时使用启动探针（StartupProbe）容器探测方法exechttpGettcpSocket容器探测使用livenessProbe使用exec使用httpGet使用tcpSocketreadinessProbe使用exec使用httpGet使用tcpSocket使用start......
D. Coloring Brackets
原题链接题解首先，假设当前\(s(l,r)\)括号序列为合法序列，则有如下几种情况：\(l+1==r\)()\(match[r]==l\)(...)\(match[r]!=l\)(...)...(...)code#include<bits/stdc++.h>usingnamespacestd;constlonglongMOD=1e9+7;longlongdp[705][705][3][3]......
一个适合普通人的兼职平台，在家做也靠谱又能赚钱
随着互联网的普及和远程工作的兴起，找到一份既能赚钱又能在家中舒适的环境下进行的兼职工作变得越来越容易。今天推荐一个正规靠谱的兼职副业平台，它提供了多种灵活的工作机会，让你在家也能有可观的收入。这个就是阿里旗下的闲鱼：点击这里安装闲鱼app，直达活动入口。闲鱼是阿里巴巴......
按条件搜索期货品种
豆粕m2409:连续10天在10日均线下方,30天内有20天在均线下方 importaxiosfrom'axios';importfsfrom'fs-extra';constinstance=axios.create();constapi={//获取纯碱实时价格asyncgetSaRealPrice(){constres=awaitinstance.get('https://fut......
wechat crawler url拼接 url解析微信爬虫 json序列化反序列化
WechatPublicRequest\Program.csusingSystem.Collections.Specialized;usingSystem.Diagnostics;usingSystem.Web;usingNewtonsoft.Json;classProgram{staticasyncTaskMain(){varlatestTxtFilePath=GetLatestTxtFilePath();......
四.mongodb问答
目录四.mongodb4.1mongodb的优势有哪些缺点4.2什么是mongodb中的document4.3什么场景下会使用mongodb4.4mongodb中的分片是什么意思4.5什么时候需要分片:4.6如何将数据分布在不同的chunk上4.7mongodb支持哪些类型的索引4.8副本集有哪些角色，是做什么的主节点（Primary）从节点（S......