首页 > 其他分享 >安装华为软件昇腾mindspore-gpu-1.9.0失败记录

安装华为软件昇腾mindspore-gpu-1.9.0失败记录

时间:2022-12-20 16:31:53浏览次数:63  
标签:1.9 version conda cuda gpu 安装 check mindspore

官网安装地址:

https://www.mindspore.cn/install

 

 

PS: 不得不说华为的软件是愈发的不好用了,这个mindspore老版本去年我是使用过的,安装也是比较方便的,搞不清这优化来优化去咋变的这么不好安装了呢。

 

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_杂谈

 

 

 

 

====================================

 

 

1. 首先选择使用conda方式安装:

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_Cuda_02

 

 

 

 

 

官网给出的安装命令:

conda install mindspore-gpu=1.9.0 cudatoolkit=11.1 -c mindspore -c conda-forge

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_杂谈_03

 

 

 

运行测试代码:

python -c "import mindspore;mindspore.run_check()"

 

报错:

[ERROR] ME(74920:140607147143488,MainProcess):2022-12-10-11:48:19.825.553 [mindspore/run_check/_check_version.py:194] Cuda ['10.1', '11.1', '11.6'] version(libcu*.so need by mindspore-gpu) is not found, please confirm that the path of cuda is set to the env LD_LIBRARY_PATH, or check whether the CUDA version in wheel package and the CUDA runtime in current device matches, please refer to the installation guidelines: https://www.mindspore.cn/install
[ERROR] ME(74920:140607147143488,MainProcess):2022-12-10-11:48:19.825.657 [mindspore/run_check/_check_version.py:194] Cuda ['10.1', '11.1', '11.6'] version(libcu*.so need by mindspore-gpu) is not found, please confirm that the path of cuda is set to the env LD_LIBRARY_PATH, or check whether the CUDA version in wheel package and the CUDA runtime in current device matches, please refer to the installation guidelines: https://www.mindspore.cn/install
[ERROR] ME(74920:140607147143488,MainProcess):2022-12-10-11:48:19.830.949 [mindspore/run_check/_check_version.py:194] Cuda ['10.1', '11.1', '11.6'] version(libcudnn*.so need by mindspore-gpu) is not found, please confirm that the path of cuda is set to the env LD_LIBRARY_PATH, or check whether the CUDA version in wheel package and the CUDA runtime in current device matches, please refer to the installation guidelines: https://www.mindspore.cn/install
[ERROR] ME(74920:140607147143488,MainProcess):2022-12-10-11:48:19.831.029 [mindspore/run_check/_check_version.py:194] Cuda ['10.1', '11.1', '11.6'] version(libcudnn*.so need by mindspore-gpu) is not found, please confirm that the path of cuda is set to the env LD_LIBRARY_PATH, or check whether the CUDA version in wheel package and the CUDA runtime in current device matches, please refer to the installation guidelines: https://www.mindspore.cn/install
[ERROR] ME(74920,7fe1a70ef140,python):2022-12-10-11:48:19.881.793 [mindspore/ccsrc/runtime/hardware/device_context_manager.cc:46] LoadDynamicLib] Load dynamic library libmindspore_gpu failed, returns [libcudnn.so.8: cannot open shared object file: No such file or directory].
MindSpore version: 1.9.0
MindSpore running check failed.
Create device context failed, please make sure target device:GPU is available.

----------------------------------------------------
- C++ Call Stack: (For framework developers)
----------------------------------------------------
mindspore/ccsrc/runtime/hardware/device_context_manager.cc:208 GetOrCreateDeviceContext

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_bc_04

 

解释一下这个报错信息,说的就是mindspore-gpu识别不到环境中的cuda和cudnn。

 

这其实就是一个十分奇葩的报错,明明使用conda安装了,cuda和cudnn都应该是conda按照依赖关系安装的,如果使用conda安装不安装依赖的cuda和cudnn环境那么和pip安装方式又有什么区别呢。

看了下官方在conda方式下面给的具体说明:

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_Cuda_05

 

 

 

 

也就是说官方虽然提供了conda的安装方式,但是实际上和pip安装方式是一样的,只不过下载源的地址不同,这着实雷到我了。

 

同时官方还提供了自动安装cuda和cudnn的脚本:

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_bc_06

 

 

 

 

执行官方给出的自动安装cuda和cudnn脚本:

 

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_bc_07

 

 

安装失败:(这个自动安装脚本失败或许是我的操作系统问题,因为这个系统是deepin系统)

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_bc_08

 

 

 

 

==============================================

 

 

2. docker安装方式

既然pip和conda安装方式都需要自己额外安装cuda和cudnn,那么使用docker安装方式就应该可以避免这个问题了,于是使用docker安装:

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_CUDA_09

 

 

 

运行镜像:

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_杂谈_10

 

 

报错信息显示nvidia驱动版本不匹配。

 

 

 

 

 

============================================================

 

 

也就是说,在nvidia显卡驱动安装成功的前提下,如果不手动安装cuda和cudnn,那么使用pip,conda,docker方式都是无法成功安装mindspore的GPU版本的,这个结果确实要人不好接受。

 

 

 

============================================================

 

 

 

 真的是太气人了,这安装的便捷性和pytorch根本没法比,也是没谁了,最后还是手动安装cuda和cudnn,然后成功安装mindspore-gpu-1.9.0:

 

安装华为软件昇腾mindspore-gpu-1.9.0失败记录_杂谈_11

 

 

 

 

 

 

 

 

 

标签:1.9,version,conda,cuda,gpu,安装,check,mindspore
From: https://blog.51cto.com/u_15642578/5956075

相关文章

  • PyTestReport-0.1.9版本更新
    文章目录​​多了哪些功能呢?​​​​如何与PyTest框架结合使用​​​​如何通过API的方式生成报告​​​​如何生成图片报告并发送邮件​​​​新书推荐​​还记得那个发布......
  • GPU并行算法读书笔记-chapter3 CUDA线程模型
    目录《GPU并行算法》读书笔记-chapter3CUDA线程模型SIMD模型SIMT模型kernel函数CUDA线程结构blockgrid线程的全局IDCUDA结构与GPU硬件的映射关系CUDA线程设计执行配置什......
  • 引力波探测,冷冻电镜研究:两项诺奖GPU功不可没
    我们的日常工作固然重要,但并非每一份重要的工作都能够助力他人获得诺贝尔奖。然而,就在2017年10月,GPU计算便两度成为了助力获得诺贝尔奖的幕后英雄。三名美国物理学家Rainer......
  • torch.version.cuda返回None,改为使用手动下载Pytorch GPU版本whl文件并安装
    用pip安装时网速实在太慢,换源也不太行,1.2G的文件,一个网络波动就开始疯狂红字。因此使用whl文件进行安装!PytorchGPU版本whl文件安装_龙倚亭的博客-CSDN博客_pytorchwhl......
  • 20220215_安装nvidia gpu
    20220215_安装nvidiagpu版本信息:centos8.5一、安装步骤:1.1.下载驱动,注意版本下载对应驱动https://www.nvidia.cn/Download/index.aspx?lang=cnlscpi//先查看硬件设备型号......
  • Python PyTorch GPU版/CUDA 环境详细安装教程(完美避坑)
    一、安装CUDA 1、安装CUDA前请先确认Torch 所支持的版本,以免安装的Torch不支持最新CUDA的版本,下图可见Torch所支持的CUDA最新版本位11.7,如果我们安装CUDA12.0版本......
  • 多GPU监测
    相信大家在跑实验时都希望让GPU二十四小时跑,但有时候实验在半夜才结束,为了避免晚上接着跑实验需要半夜起床,同时为了不浪费计算资源,我们可以对多个GPU进行实时监测,当监测到G......
  • windows上用vs2017静态编译onnxruntime-gpu CUDA cuDNN TensorRT的坎坷之路
    因为工作业务需求的关系,需编译onnxruntime引入项目中使用,主项目exe是使用的vs2017+qt5.12。onnxruntime就不用介绍是啥了撒,在优化和加速AI机器学习推理和训练这块赫赫有名......
  • 五年经验的前端社招被问:CPU 和 GPU 到底有啥区别?
    首先来看CPU和GPU的百科解释:CPU(CentralProcessingUnit,中央处理器):功能主要是解释计算机指令以及处理计算机软件中的数据GPU(GraphicsProcessingUnit,图形处理器;......
  • Flink1.9.2源码编译和使用
    欢迎访问我的GitHub这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos为什么要编译flink源码用于学习,在IDEA上开发的flinkjob,能直接......