首页 > 其他分享 >【yolox训练过程中遇到的问题集合】

【yolox训练过程中遇到的问题集合】

时间:2023-09-29 10:02:17浏览次数:24  
标签:文件 训练 文件名 self cache yolox 集合 txt

(这里写目录标题)

深度学习遇到的一系列bug

VScode无法激活conda

打开vscode,选择左上角的文件—首选项—设置 点击右上角的小图标 在这里插入图片描述 进入setting.json后,添加一行代码,重启VScode终端即可成功激活conda

"terminal.integrated.defaultProfile.windows": "Command Prompt" 在这里插入图片描述

1.vscode加载web 视图报错

Error: Could not register serviceworkers: InvalidstateError: Failed to regist

解决方法 关闭vscode,win+R,输入cmd,输入指令

code --no-sandbox 即可顺利解决

2.CUDA out of memory

CUDA out of memory. Tried to allocate 26.00 MiB (GPU 0; 8.00 GiB total capacity; 19.13 GiB already allocated; 0 bytes free; 19.15 GiB reserved in total by PyTorch)

解决方法 可能是在训练过程中将batch_size设置过大,导致内存不足,减少batch_size数字即可

3.voc2007数据集中的txt文件

train.txt 是训练图片文件的文件名列表 (训练集) val.txt是验证的图片文件的文件名列表 (验证集) trianval.txt是训练和验证的图片文件的文件名列表 test.txt 是测试的图片文件的文件名列表 (测试集) train是网络模型在训练时所使用的文件名,而val是网络模型在训练过程中进行测试时使用的文件名。val不影响模型训练,在训练的时候可以得到train和val这两个数据集的误差率,利用这个误差率绘制学习曲线,观察学习曲线,可以发现一些网络模型的问题,根据这些问题去调整网络参数。test是网络模型训练完进行测试。

4.object has no attribute ‘cache‘

将yolox/data/datasets/voc.py下的190行左右

@cache_read_img def read_img(self, index, use_cache=True):

修改为

@cache_read_img(use_cache=True) def read_img(self, index):

将yolox/data/datasets/voc.py 文件的

(self._imgpath % self.ids[i]).split(self.root + "/") (self._imgpath % self .ids[i]).split(self.root + "\\") 在这里插入图片描述

5.KeyError:'model'

找不到权重文件,进行权重文件(.pth)的更换即可 在这里插入图片描述

6.No module named loguru

激活环境,输入

pip install loguru -i https://pypi.tuna.tsinghua.edu.cn/simple

7.Python AttributeError: module ‘distutils‘ has no attribute ‘version‘

这里不建议进行torch版本的升级,很可能会导致torch升级后和环境中的其它包不在版本匹配,并且默认升级的命令升级的为CPU版本的torch **解决方法:**激活anaconda所配置的虚拟环境后,输入

pip install setuptools==59.5.0

将版本进行固定,即可成功解决此bug

后续遇到问题还会进行更新

标签:文件,训练,文件名,self,cache,yolox,集合,txt
From: https://blog.51cto.com/u_16202928/7647649

相关文章

  • 集合运算
    01集合运算1集合 A和 B的并集或 特点:由集合 A和 B的所有元素组成的集合. 2集合 A和 B的交集且 特点:由集合 A和 B的公共元素组成的集合. 3集合 A和 B的差集特点:由属于 A,而不属于 B的所有元素组成的集合. 4集合 A的补集∼ A= 特点:由属于全集 E但......
  • Flutter/Dart第03天:Dart可迭代集合
    Dart官网代码实验室:https://dart.dev/codelabs/iterables重要说明:本博客基于Dart官网代码实验室,但并不是简单的对官网文章进行翻译,我会根据个人研发经验,在覆盖官网文章核心内容情况下,加入自己的一些扩展问题和问题演示和总结,包括名称解释、使用场景说明、代码样例覆盖等。可迭代......
  • 集合的概念
    01集合的概念1集合与元素具有确定的,可以区分的若干事物的全体称为集合,其中的事物叫元素.集合的元素不能重复出现,集合中的元素无顺序之分.集合与其元素之间存在属于“”或不属于“”关系.集合 A 中元素的个数为集合的元数,记作| A |.理解集合概念时请注意:(1)集合中的元素是确......
  • GLM大模型训练
    ChatGPTBook/LLMFTProjNameLastcommitmessageLastcommitdateparentdirectory..ChatGLM-6B(Directory)updatecode3monthsagodata(Directory)updatecode3monthsagoimages(Directory)u......
  • mssql中常用的字符串函数大集合
    1.绝对值SQL:selectabs(-1)valueO:selectabs(-1)valuefromdual2.取整(大)S:selectceiling(-1.001)valueO:selectceil(-1.001)valuefromdual3.取整(小)S:selectfloor(-1.001)valueO:selectfloor(-1.001)valuefromdual4.取整(截取)S:selectcast(-1.002asint)v......
  • 尝试用ColabPro训练深度学习模型
    Colab中使用.ipynb文件,即我们平时使用的JupyterNotebook文件来完成相关代码的执行。如果要训练模型,需要将模型封装成可以经过ipynb文件执行的形式。在具体的运行时类型中,可以选择不同的运行时,其中包含了可选的GPU和CPU。GPU中有V100、A100、T4这几种可以选择,在选择相应的资源连......
  • 深度学习 学习与训练中遇到的问题 记录
    RuntimeError:Sizesoftensorsmustmatchexceptindimension1.Got61and60indimension2错误产生原因:在模型中有以下操作:torch.cat(x,y)   当x,y的尺寸不一致时,就会出现以上错误。   进行单步调试,发现我的错误是因为图像山采样和下采样后,由于取整的......
  • Windows开3389集合
    ###Windowsserver2003/Windowsxpnetstarttermserviceregadd"HKLM\SYSTEM\CurrentControlSet\Control\TerminalServer"/vfSingleSessionPerUser/tREG_DWORD/d0/fwmicpathwin32_terminalservicesettingwhere(__CLASS!="")call......
  • 腾讯云 Cloud Studio 实战训练营结营&活动获奖公示
    点击链接了解详情“腾讯云CloudStudio实战训练营”是由腾讯云联合CSDN推出的系列开发者技术实践活动,通过技术分享直播、动手实验项目、优秀代码评选、有奖征文活动等,让广大开发者沉浸式体验腾讯云开发者工具CloudStudio的同时,实现技术实战能力提升。本次实战训练营活......
  • 算法训练day22 LeetCode235
    算法训练day22LeetCode235.701.450.235.二叉搜索树的最近公共祖先题目235.二叉搜索树的最近公共祖先-力扣(LeetCode)题解代码随想录(programmercarl.com)对于二叉树,可以用递归回溯的方式对于二叉搜索树,由其根节点大于左右子树中结点,所以当第一次遍历到根节点值......