首页 > 其他分享 >项目场景 with ERRTYPE = cudaError CUDA failure 999 unknown error

项目场景 with ERRTYPE = cudaError CUDA failure 999 unknown error

时间:2023-06-02 12:03:46浏览次数:45  
标签:cudaError 10.2 const onnxruntime unknown 999 char cuda ERRTYPE


项目场景 [with ERRTYPE = cudaError; bool THRW = true] CUDA failure 999: unknown error ; GPU=24 :

需要升级之前老的程序,之前的cuda 是10.2


问题描述:

环境

cuda 11.2 (之前是10.2)

onnxruntime-gpu 1.10

python 3.9.7

项目场景 with ERRTYPE = cudaError CUDA failure 999 unknown error_CUDA

启动程序的时候

Traceback (most recent call last):
  File "/home/aiuser/cover/liheng-foggun/app.py", line 15, in <module>
    model = DetectMultiBackend(weights=config.paddle.model_file)
  File "/home/aiuser/miniconda3/envs/cover/lib/python3.9/site-packages/torch/autograd/grad_mode.py", line 28, in decorate_context
    return func(*args, **kwargs)
  File "/home/aiuser/cover/liheng-foggun/models/yolo.py", line 37, in __init__
    self.session = onnxruntime.InferenceSession(weights, providers=['CUDAExecutionProvider'])
  File "/home/aiuser/miniconda3/envs/cover/lib/python3.9/site-packages/onnxruntime/capi/onnxruntime_inference_collection.py", line 335, in __init__
    self._create_inference_session(providers, provider_options, disabled_optimizers)
  File "/home/aiuser/miniconda3/envs/cover/lib/python3.9/site-packages/onnxruntime/capi/onnxruntime_inference_collection.py", line 379, in _create_inference_session
    sess.initialize_session(providers, provider_options, disabled_optimizers)
RuntimeError: /onnxruntime_src/onnxruntime/core/providers/cuda/cuda_call.cc:122 bool onnxruntime::CudaCall(ERRTYPE, const char*, const char*, ERRTYPE, const char*) [with ERRTYPE =
 cudaError; bool THRW = true] /onnxruntime_src/onnxruntime/core/providers/cuda/cuda_call.cc:116 bool onnxruntime::CudaCall(ERRTYPE, const char*, const char*
, ERRTYPE, const char*) [with ERRTYPE = cudaError; bool THRW = true] CUDA failure 999: unknown error ; GPU=24 ; hostname=aiserver-sl-01 ; expr=cudaSetDevice(info_.device_id);

原因分析:

1.刚开始以为是onnxruntime-gpu 版本问题 升级到了 1.12 还是报错

2.网上又说是不兼容的问题

3.试试重装下驱动,卸载了11.2 的时候 通过nvidia-smi 发现之前10.2的驱动还存在

4.是因为之前的驱动没有卸载干净


解决方案:

1.卸载10.2

sudo /usr/local/cuda-10.2/bin/cuda-uninstaller

2.安装新驱动

#离线安装 515.57
sudo ./NVIDIA-Linux-x86_64-515.57.run -no-x-check -no-nouveau-check

VIDIA-Linux-x86_64-515.57.run -no-x-check -no-nouveau-check


标签:cudaError,10.2,const,onnxruntime,unknown,999,char,cuda,ERRTYPE
From: https://blog.51cto.com/u_16015778/6401435

相关文章

  • python的peft包导入PeftModel时报importerror-cannot-import-name-unknown-location
    一般出现这种问题的原因是该版本的peft包中没有PeftModel,这种情况都需要降级。我验证了以下,我实在alpaca-lora项目中使用peft,alpaca-lora的项目大概在2个月以前更新,而peft包实在最近更新的4.0版本,而2个月以前peft还是2.0版本,所以我果断把peft降到2.0版本,然后问题就解决了。......
  • docker login harbor x509: certificate signed by unknown authority
    前言dockerloginharborx509:certificatesignedbyunknownauthority解决打开/etc/docker/daemon.json,如果没有这个文件新增即可vim/etc/docker/daemon.json加入insecure-registries{"insecure-registries":["harbor.xxxx.com:1111"]}重启dockersudo......
  • Flutter安装会显示Android license status unknown.
    [Flutter安装问题(持续更新版)-简书](https://www.jianshu.com/p/55bca250ace4)问题1:XAndroidlicensestatusunknown.解决办法:安装一直卡死在这,主要是执行了他提示的那个license命令后,会显示“Androidsdkmanagertoolwasfound,butfailedtorun(D:\Android\AndroidSDK......
  • VFS: Unable to mount root fs on unknown-block
    [1.736146]Listofallpartitions:[1.736921]fd00256000vda[1.736928]driver:virtio_blk[1.737723]Nofilesystemcouldmountroot,tried:[1.737723][1.738136]Kernelpanic-notsyncing:VFS:Unabletomountrootfs......
  • docker exec unknown shorthand flag: 'i' in -it
    当你使用的是以下图中的命令时:出现以上的报错,那就是因为tomcat这个容器中没有ping命令,需要单独下载。先进入容器:dockerexec-it容器名或容器id/bin/bash进入容器执行,apt-getinstallnet-tools命令再执行,apt-getinstalliputils-ping命令容器不停止退出:Ctrl+P+Q然后再次......
  • [NOIP1999 普及组] 导弹拦截
    [NOIP1999普及组]导弹拦截题目描述某国为了防御敌国的导弹袭击,发展出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷:虽然它的第一发炮弹能够到达任意的高度,但是以后每一发炮弹都不能高于前一发的高度。某天,雷达捕捉到敌国的导弹来袭。由于该系统还在试用阶段,所以只有一套......
  • 洛谷 P7999 [WFOI - 01] 翻转序列(requese)
    洛谷传送门注意到如果\(n\)足够小,可以过\(n^2\)。选\(x=3\)(这样做的好处是能交换两个相邻元素),每次把值为\(i\)的元素挪到\(i\),注意到我们不关心其他元素,所以翻转\([l,r]\)的效果可以看成是交换\(p_l,p_r\)。于是先跳大步,再跳小步。可以过\(n\le100\),拿到50分......
  • P5930 [POI1999] 降水
    //木桶原理:桶能装的水的多少取决于最短的木板。#include<iostream>#include<cstdio>#include<stack>#include<cstring>#include<queue>usingnamespacestd;intn,m;constintmaxn=305;inta[maxn][maxn];boolvis[maxn][maxn];structnode{ intx,y,h......
  • 高效率华 为16KW三相PFC程序方案: 98.916%效率、功率因数0.9995、电流
    高效率华为16KW三相PFC程序方案:98.916%效率、功率因数0.9995、电流谐波2.287%,在三相交流源输入380Vac,输出720Vdc、16KW时。本方案在华为充电模块R75020G1机上进行重新设计包括:1、PFC板原理图(AltiumDesigner10),保证99%的线路正确。2、整个CCS工程文件,C语言程序。3、半导体器件......
  • Oracle TO_CHAR(待格式化数据, 'FM99999990.00')
    作用:对数据进行格式化①其9代表:如果存在数字则显示数字,不存在则显示空格②其0代表:如果存在数字则显示数字,不存在则显示0,即占位符。③其FM代表:删除如果是因9带来的空格,则删除之......