首页 > 其他分享 >【已解决】运行onnxruntime-gpu时遇到RuntimeError问题

【已解决】运行onnxruntime-gpu时遇到RuntimeError问题

时间:2025-01-03 21:33:04浏览次数:1  
标签:onnxruntime RuntimeError 1.18 CUDA GPU gpu

  1. 问题描述

在使用onnxruntime进行模型推理时希望使用GPU进行加速,但运行时出现RuntimeError
具体报错如下:
*************** EP Error ***************
EP Error D:\a_work\1\s\onnxruntime\python\onnxruntime_pybind_state.cc:891 onnxruntime::python::CreateExecutionProviderInstance CUDA_PATH is set but CUDA wasnt able to be loaded. Please install the correct version of CUDA andcuDNN as mentioned in the GPU requirements page (https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html#requirements), make sure they're in the PATH, and that your GPU is supported.
when using ['CUDAExecutionProvider']
Falling back to ['CUDAExecutionProvider', 'CPUExecutionProvider'] and retrying.

2. 解决问题都干了什么

  • 首先把cunda安装目录都添加到了path 环境变量里
  • 重新安装了onnxruntime-gpu   == 1.18.1 # 从原来的1.18.0===》更改为1.18.1,没啥用可能
  • 卸载了onnxruntime   == 1.18.0 ,运行报了新错误,pydoc.ErrorDuringImport: problem in cosyvoice.flow.flow_matching - ImportError: cannot import name 'InferenceSession' from 'onnxruntime' (unknown location)
  • 然后直接安装 onnxruntime-gpu  最新版 ,没有指定版本,默认是1.19.2,成功启动

其他可能有用:

  1. GPU型号与onnxruntime不兼容:你的显卡是NVIDIA GeForce RTX 4070,可能不在onnxruntime支持的GPU列表中。你可以查看onnxruntime的官方文档,确认你的GPU型号是否被支持。如果不支持,你可能需要降级你的GPU驱动或者更换一个受支持的GPU。
  2. CUDA\v11.8 + cudnn-windows-x86_64-8.9.7.29 + onnxruntime-gpu   == 1.18.1

标签:onnxruntime,RuntimeError,1.18,CUDA,GPU,gpu
From: https://www.cnblogs.com/ubuntulolo/p/18650951

相关文章

  • CUDA编程【5】获取GPU设备信息
    文章目录通过cudaAPI获取1.获取设备数量2.获取当前设备ID3.设置当前设备4.获取设备属性5.获取设备限制6.获取设备共享内存配置7.获取设备缓存配置8.获取设备是否支持统一内存9.获取设备是否支持并发内核执行10.获取设备的最大线程块数11.获取设备的时钟频率......
  • 1.GPU简介及英伟达开发环境配置
    前言Thisbookshowshow,byharnessingthepowerofyourcomputer’sgraphicsprocessunit(GPU),youcanwritehigh-performancesoftwareforawiderangeofapplications.Althoughoriginallydesignedtorendercomputergraphicsonamonitor(andstillus......
  • 利用CUDA编程实现在GPU中对图像的极坐标变换加速
    问题来源:1.需要对输入图像中的一个环形区域,进行极坐标逆变换,将该环形区域转换为一张新的矩形图像2.opencv没有直接对环形区域图像进行变换的函数,需要通过循环遍历的方式,利用polarToCart进行转换3.循环遍历不可避免的带来速度上的问题,尤其是图片较大时解决思路1:使用open......
  • GPU编程最佳语言
    GPU编程最佳语言‌GPU编程的最佳语言选择取决于具体的应用场景和开发者的需求。以下是几种常用的GPU编程语言及其优缺点‌:‌CUDA‌:‌优点‌:CUDA是NVIDIA推出的并行计算平台和编程模型,基于C++,提供了丰富的库和工具,适用于需要直接访问GPU硬件的高性能计算任务。CUDA具有较低的......
  • 必要性论证:将FPGA深入应用于基于CPU、CPU+GPU的人形机器人控制系统
    目录:0前言1需求侧的基本事实1.1实用化的人形机器人的控制系统必须实现感算控一体1.2感算控环路必须具备强实时性(低延迟量+低延迟抖动量)1.3感知环节必须以高帧率+高分辨率、在多个位置+多个方向并行采集人形机器人本体、环境、任务对象的多种信息1.4强实时性的感算......
  • 高性能计算-GPU编程模型(21)
    1.GPU的内存模型GPU编程数据需要从CPU主存拷贝到GPU全局存储器,所有线程共享全局存储。开辟的全局存储器空间指针在CPU代码中不能解引用使用,应在计算完结果后再拷贝回CPU主存空间。线程块内共享存储。(1)线程私有的存储有寄存器、本地内存(2)线程块内有块内线程共享的共享内......
  • 欧拉系统安装GPU驱动
    安装NVIDIADriver进入英伟达官网下载页面按照以上方式选择即可得到>535.113.01版本的驱动,可以实现多卡推理,小于这个版本会导致多卡训练以及推理报错虽然最新版本为550.54.15,但是535版本更加稳定,并且pytorch目前只支持到12.1,而在CUDAToolkit选择栏中没有这个版本,所以选择12.2......
  • GPU gdm /etc/X11/xorg.conf
    【本文适用环境:Redhat或CentOS】前提:nvidia-smi能正常读取GPU卡信息关闭gdm[root@host~]#systemctlstopgdm查询系统下是否存在/etc/X11/xorg.conf文件,如果不存在则执行下述步骤生成配置文件[root@host~]#nvidia-xconfig--query-gpu-infoNumberofGPUs:1GP......
  • 绕过CPU:英伟达与IBM致力推动GPU直连SSD以大幅提升性能
    绕过CPU:英伟达与IBM致力推动GPU直连SSD以大幅提升性能|Id|Title|DateAdded|SourceUrl|PostType|Body|BlogId|Description|DateUpdated|IsMarkdown|EntryName|CreatedTime|IsActive|AutoDesc|AccessPermission||-------------|-------------|---......
  • python网络编程之http longpull
    服务端:fromflaskimportFlask,request,jsonifyimporttimeapp=Flask(__name__)@app.route('/stream',methods=['GET'])defpoll():#假设这里有一个方法来检查是否有新数据#为了示例,我们简单地模拟等待数据time.sleep(5)#模拟处理时间或等待......