train/val/test 的关系
-
纯训练命令行参数
mode=train val=False model=yolov8n.pt
-
训练+val命令行参数
mode=train val=True model=yolov8n.pt
-
验证预训练模型的命令行参数
mode=val split=val model=yolov8n.pt
-
验证自有模型的命令行参数
mode=val split=val model=best.pt
-
测试自有模型的命令行参数
mode=val split=test model=best.pt
-
train 数据集: 用于训练模型的数据集
-
val 数据集: 一般我们需要反复多次train才能得到一个较好的模型, val就在训练阶段用来验证每次模型结果的泛化能力和性能. val和train 数据集最好没有交集, 但如果总数据集较少也可以使用部分train数据作为val 数据集.
-
test 数据集: test 是模型正式使用之前, 用于训练阶段从未见到的数据验证模型效果结果, test 数据集绝对不能和train/val数据集有任何交集.
-
train/val/test数据集比例: 数据量较大情况下可以选择8:1:1 , 数据集较小情况下可以选择 6:2:2.
-
train/val/test 数据集分隔工具: https://github.com/jfilter/split-folders