首页 > 其他分享 > CUDA_ERROR_OUT_OF_MEMORY: out of memory

CUDA_ERROR_OUT_OF_MEMORY: out of memory

时间:2023-10-08 09:36:01浏览次数:44  
标签:查看 MEMORY ERROR watch 命令 CUDA smi nvidia 内存

 

2023-02-04 22:17:02.457962: I tensorflow/stream_executor/cuda/cuda_driver.cc:831] failed to allocate 152.00M (159383552 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY: out of memory

 

查看GPU内存使用情况:

nvidia-smi

 

 

 

命令行如何查看GPU的内存使用情况?

 

 

查看CPU内存使用情况

1、输入命令:top,

 

 




2、输入命令:htop,

 

 


若没有该命令,需要先安装,ubuntu安装命令为:
sudo apt-get install htop

centos安装命令为:
yum install htop

查看GPU内存使用情况
1、输入命令: nvidia-smi ,该命令只能显示一次。

2、实时显示
1)使用watch命令, 按照指定间隔刷新,例如下面命令是每隔1s刷新一次

watch -n 1 nvidia-smi

2)watch每个时间周期开启一个进程(PID),查看后关闭进程,会影响cuda操作,建议使用nvidia-smi -l n或者nvidia-smi --loop=n,这个命令执行期间一直是一个进程PID。例如下面命令是每隔1s刷新一次。
nvidia-smi -l 1
————————————————
链接:https://blog.csdn.net/lansebingxuan/article/details/126105299

 

标签:查看,MEMORY,ERROR,watch,命令,CUDA,smi,nvidia,内存
From: https://www.cnblogs.com/emanlee/p/17092541.html

相关文章

  • AttributeError: 'NoneType' object has no attribute 'dtype'
     ---------------------------------------------------------------------------AttributeErrorTraceback(mostrecentcalllast)/tmp/ipykernel_23207/4182898696.pyin<module>45......
  • PaddleOCR安装过程中的ERROR
    PaddleOCR安装过程中的ERROROSError:(External)CUDAerror(222),theprovidedPTXwascompiledwithanunsupportedtoolchain..[Hint:'cudaErrorUnsupportedPtxVersion'.ThisindicatesthattheprovidedPTXwascompiledwithanunsupportedtoolchain.Th......
  • TypeError: Cannot read properties of undefined (reading '0')
    今天取请求返回值时报的一个错误,要取返回值中数组下标为零的数据,错误显示说未定义。检查之后发现要取的数据是请求返回的data中data,少嵌套了一层data导致数据为空报错。(返回数据的路径可以右键Copypropertypath,这样就不会错了)......
  • [已解决] Compilation error ptxas fatal : Value ‘sm_30‘ is not defined for opti
    在用cmake编译cuda程序时,总是报Compilationerrorptxasfatal:Value‘sm_30’isnotdefinedforoption‘gpu-name’问题,也是折腾了好久,感谢这位小哥的解决方案,亲试无误,万分感谢~转载:https://blog.csdn.net/Fucking_Code0916/article/details/132429186安装tiny-cudann出......
  • Exception in thread "main" java.lang.UnsupportedClassVersionError: org/example/J
    问题描述使用hadoop在虚拟机里面运行打包的程序出错:问题解决真的服了,貌似是jdk的版本啥的问题,搜了好多,就是解决不了,求助求助啊!......
  • GPT之路(九) LangChain - Memory
          记忆封装-Memory(langchainmemory)         Memory:这里不是物理内存,从文本的角度,可以理解为“上文”、“历史记录”或者说“记忆力”的管理          ConversationBufferMemory可也用来保留会话信息 ......
  • 报错AttributeError: Attempted to set WANDB to False, but CfgNode is immutable
    问题 今天在跑代码的时候,使用到了wandb记录训练数据。 我在23服务器上跑的好好的,但将环境迁移到80服务器上重新开始跑时,却遇到了如下报错 看这个报错信息是由于wandb没有apis这个属性,于是我定位到具体的报错代码 ......
  • MaSuRCA 软件安装 swig/perl5/swig_wrap.cpp:342:20: fatal error: string.h: No such
     001、问题MaSuRCA软件安装swig/perl5/swig_wrap.cpp:342:20:fatalerror:string.h:Nosuchfileordirectory  002、原因,当前环境处于conda的base环境,可能是函数库调用混乱。  003、解决方法,推出conda基础环境安装(base)[b20223040323@admin1MaSuRCA-4......
  • C error:deprecated conversion from string constant to 'char*' [-Wwrite-strings]
    问题描述解决C++中[Warning]deprecatedconversionfromstringconstantto'char*'[-Wwrite-strings]char*string="aaabbbcc";//warning的原因是字符串常量存放在const内存区...原因主程序初始化字符串,是字符串常量,该字符串的内存分配在全局的const内存区。......
  • vue-router.esm.js:2065 Uncaught (in promise) Error: Redirected when going from "
    原因:  vue-router路由版本更新产生的问题,导致路由跳转失败抛出该错误;真正的原因是由于返回了一个Promise对象,正常的跳转由then方法执行当正常的路由跳转,被"路由导航守卫"拦截并重新指定路由时,由于this.$router.push()返回的是Promise对象,此时then方法不能正常执......