首页 > 其他分享 >kaggle白嫖相关

kaggle白嫖相关

时间:2023-01-07 17:02:55浏览次数:32  
标签:文件 训练 离线 kaggle 更新 模块 相关


文章目录

  • ​​在kaggle上使用gdown​​
  • ​​挂机训练​​
  • ​​修改、添加模块中的文件​​
  • ​​参考博客​​

在kaggle上使用gdown

首先需要安装gdown

pip install -U --no-cache-dir gdown --pre

挂机训练

#将input的文件移动到output
import shutil
shutil.copytree(r'/kaggle/input/cronkgqa/', r'/kaggle/working/cronkgqa/')

当调试代码成功运行后,由于深度学习模型训练都需要耗费大量的时间,而像kaggle这种线上的训练网站可能会出现内核挂掉,所以我们可以在进入训练状态后选择保存此时的版本,让模型离线训练,这样我们就只要在训练完成后下载权重文件即可。

但是需要注意的:第一,虽然kaggle每周给予每人41小时的免费gpu时长,但是一次训练最长持续12个小时,超过时长则会自动停止训练。第二,当你选择保存版本离线训练时,需要注意此时离线训练的环境也在使用你的gpu免费训练时长,如果你不退出kaggle而是继续开启gpu看着模型训练,那么你将会使用两倍的gpu训练时长。

下面是离线训练的操作示例。

kaggle白嫖相关_上传


kaggle白嫖相关_人工智能_02

kaggle白嫖相关_深度学习_03


kaggle白嫖相关_离线_04


kaggle白嫖相关_上传_05


经过上述步骤我们就可以得到一个训练好的权重文件了,将权重文件下载出来就可以直接使用测试程序测试了。

修改、添加模块中的文件

如果要修改或者增减模块的文件,需要首先更新数据集版本,然后再notebook中刷新模块的版本号。具体操作如下:

1、在kaggle的【datasets】中找到自定义的数据集,并打开数据集。

kaggle白嫖相关_离线_06


2、打开数据集后,点击页面底部的【new version】,更新数据集版本:

kaggle白嫖相关_离线_07


3、在弹出的窗口中,将修改过的模块【document】重新上传到数据集中,上传时系统会记录上传的时间作为版本号,见下图【Date Update 2022./06/28】:

kaggle白嫖相关_数据集_08


4、更新完数据集后,回到notebook,将光标移到模块上,会有【more actions选项】,并选择其中的【pin to version】更新模块。

kaggle白嫖相关_人工智能_09


kaggle白嫖相关_离线_10

5、在弹出的窗口中选择要更新的版本号来更新。

kaggle白嫖相关_数据集_11


更新完模块后,模块会显示重新上传的文件内容。至此,模块的更新修改完毕。

kaggle白嫖相关_数据集_12

标签:文件,训练,离线,kaggle,更新,模块,相关
From: https://blog.51cto.com/u_14608932/5995635

相关文章