首页 > 其他分享 >语义分割——YOLOv8-Seg 参数汇总与调参建议

语义分割——YOLOv8-Seg 参数汇总与调参建议

时间:2024-06-13 15:25:58浏览次数:29  
标签:None False 训练 调参 YOLOv8 Seg 是否 True 调整

语义分割——YOLOv8-Seg 参数汇总与调参建议
train 参数
参数 默认值 说明 调参建议
model None 模型文件的路径,如 yolov8m.pt -
data None 数据文件的路径,如 coco128.yaml -
epochs 100 训练周期 根据数据集大小和模型复杂度调整
time None 训练的小时数,如果已提供,则覆盖epochs 如果有时间限制,可设置该参数
patience 50 在没有明显改善的情况下,提前停止训练的等待时间 根据训练过程中的收敛情况调整
batch 16 每批图像数(-1 表示自动批次) 根据 GPU 内存大小调整
imgsz 640 输入图像尺寸 根据数据集图像大小和硬件限制(如 GPU 内存)调整
save True 是否 保存训练 checkpoint 和 预测结果 -
save_period -1 每 x 周期保存一次 checkpoint(如果 < 1 则禁用) -
cache False 是否 使用缓存加载数据 根据数据集大小和加载速度决定
device None 运行设备,如device = 0或device = cpu 根据硬件资源分配合适的设备
workers 8 加载数据的工作线程数 根据系统资源和数据集大小调整
project None 项目名称 -
name None 实验名称 -
exist_ok False 是否 覆盖现有实验 -
pretrained True 是 使用预训练模型 还是 使用模型加载权重 -
optimizer auto 使用的 优化器,选择 = [SGD、Adam、Adamax、AdamW、NAdam、RAdam、RMSProp、auto](auto表示系统自动动态选择优化器) 根据模型和数据选择最优优化器
verbose False 是否 打印详细输出 -
seed 0 随机种子 设置种子以保证实验可重复性
deterministic True 是否 启用确定性模式 在需要确保结果一致性时启用
single_cls False 是否 将多类别数据当作单一类别训练 在单类别训练场景中启用
rect False 矩形训练,每批都经过整理,以减少填充物 -
cos_lr False 是否 使用余弦学习率调度器 有助于细致调整模型参数,适用于长周期训练
close_mosaic 10 最后 x 个周期 禁用 mosaic 数据增强 根据训练进展调整增强策略(参考:数据增强之 Mosaic - 知乎 (zhihu.com))
resume False 是否 从上一个 checkpoint 恢复训练 -
amp True 是否 使用自动混合精度(AMP)训练 在硬件支持的情况下启用以提高训练效率(利用半精度浮点数加速训练过程,可以减少显存占用)
fraction 1.0 训练集使用的数据比例 -
profile False 训练期间是否 分析 ONNX 和 TensorRT 速度 -
freeze None 在训练过程中 冻结前 n 层,或冻结层索引列表 在迁移学习场景中冻结特定层
lr0 0.01 初始学习率 根据模型和数据集大小调整
lrf 0.01 最终学习率 根据训练策略调整
momentum 0.937 SGD 动量 / Adam 的 beta1 根据优化器类型和训练过程调整
weight_decay 0.0005 优化器权重衰减 防止过拟合时调整,过大会导致欠拟合
warmup_epochs 3.0 预热周期数(可以是分数) 根据模型和数据集调整热身期
warmup_momentum 0.8 预热初始动量 在预热时调整动量以稳定训练
warmup_bias_lr 0.1 预热偏置的学习率 在预热时适当提高偏置项的学习率
box 7.5 边框损失增益(值越大越表强调) 根据训练输出的box_loss调整
cls 0.5 类别损失增益(值越大越表强调,按像素缩放) 根据训练输出的cls_loss调整
dfl 1.5 DFL 损失增益 根据训练输出的dfl_loss调整
pose 12.0 姿态损失增益(仅 pose 训练) -
kobj 2.0 关键点对象损失增益(仅 pose 训练) -
label_smoothing 0.0 标签平滑,一种正则化技术,用于减少模型对训练数据的过拟合程度 在多类别分类中使用以提高整体泛化性,通常取0.1,过大会导致欠拟合
nbs 64 标称批量,训练过程中每个批次的大小 根据 GPU 内存和模型大小调整
overlap_mask True 是否 遮罩应在训练期间重叠(仅 seg 训练) -
mask_ratio 4 mask 降采样比率(仅 seg 训练,mask 的尺寸将缩小为原来的 1/x) -
dropout 0.0 使用 dropout 正则化(仅 cls 训练) 如果设置为非零值,则在训练过程中使用丢弃正则化来 减少模型的过拟合
val True 是否 在训练期间验证/测试 -
plots False 是否 在训练/评估过程中保存绘图和图像 -
predict 参数
参数 默认值 说明 调参建议
source ultralytics/assets 图片或视频的源目录 -
conf 0.25 用于检测的 对象置信阈值,只有置信度高于此阈值的对象才会被检测出来 根据训练结果的F1_curve.png调整
iou 0.7 非极大值抑制(NMS)的交并比(IoU)阈值 用于去除重叠的检测框,只保留具有最高置信度的框
imgsz 640 输入图像尺寸 根据数据集图像大小和硬件限制(如 GPU 内存)调整
half False 使用 半精度(FP16) 半精度可以减少计算量,但可能会牺牲一些精度
device None 运行设备,如device = 0或device = cpu 根据硬件资源分配合适的设备
max_det 300 每个图像的最大检测数 根据实际应用场景和性能需求调整
vid_stride False 视频帧率步长 根据需要调整视频处理的帧率
stream_buffer False 缓冲所有流帧(True)或 返回最近的帧(False) 根据实时处理需求和资源限制调整
visualize False 是否 可视化模型特征 -
augment False 是否 对预测源应用图像增强 -
agnostic_nms False 是否使用 类别不可知(无关)的非极大值抑制(NMS) 在检测不区分类别的应用场景中启用
classes None 按类别筛选结果,即classes = 0或classes = [0,2,3] -
retina_masks False 是否使用 高分辨率的分割掩膜 在进行高精度分割任务时启用
embed None 返回给定层的特征向量/嵌入 -
show False 如果环境允许,是否 显示预测的图像和视频 -
save False 是否 保存 预测的 图像和视频 -
save_frames False 是否 保存 预测的 单个视频帧 -
save_txt False 是否将 结果保存为 .txt 文件 -
save_conf False 是否将 检测结果与置信度分数一起保存 -
save_crop False 是否 保存裁剪的图像与结果 -
show_labels True 是否 显示预测标签 -
show_conf True 是否 显示预测置信度 -
show_boxes True 是否 显示预测边界框 -
line_width Noneorint 边界框的线宽(如果为None,则缩放为图像大小) 根据可视化需求和图像大小调整

标签:None,False,训练,调参,YOLOv8,Seg,是否,True,调整
From: https://www.cnblogs.com/SunshineWeather/p/18245935

相关文章

  • LISA: Reasoning Segmentation via Large Language Model
    Motivation&Abs现有的感知系统依赖人类的指示,难以主动推理以理解人类意图。新任务:reasoningsegmentation,模型需要根据给定的复杂/具有隐含意义的文本输出相应的segmask。新的benchmark:包含1000张左右图像的数据集(image-instruction-mask)。模型:LISA,既有LLM的语言生成能力......
  • yolov8分割法 C++部署
     使用的命令:condalist 参考资料https://github.com/triple-Mu/YOLOv8-TensorRT/blob/main/docs/Segment.md1.python3export-seg.py--weight./0.0.0/yolov8s-seg.pt--opset11--sim--input-shape13640640--devicecuda:0报错:ModuleNotFoundError:Nomodule......
  • YOLOv10、YOLOv9 和 YOLOv8 在实际视频中的对比
    引言目标检测技术是计算机视觉领域的核心任务之一,YOLO(YouOnlyLookOnce)系列模型凭借其高效的检测速度和准确率成为了业界的宠儿。本文将详细对比YOLOv10、YOLOv9和YOLOv8在实际视频中的表现,探讨它们在性能、速度和实际应用中的差异,为读者提供选择适合自身项目的YOLO模型......
  • 【YOLOv8改进】HAT(Hybrid Attention Transformer,)混合注意力机制 (论文笔记+引入代
    YOLO目标检测创新改进与实战案例专栏专栏目录:YOLO有效改进系列及项目实战目录包含卷积,主干注意力,检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例摘要基于Transformer的方法在低级视觉任务中表现出色,例如图像超分辨率。......
  • 【YOLOv8改进】EMA(Efficient Multi-Scale Attention):基于跨空间学习的高效多尺度注意力
    YOLO目标检测创新改进与实战案例专栏专栏目录:YOLO有效改进系列及项目实战目录包含卷积,主干注意力,检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例摘要通道或空间注意力机制在许多计算机视觉任务中表现出显著的效果,可以......
  • 【YOLOv8改进】ACmix(Mixed Self-Attention and Convolution) (论文笔记+引入代码)
    YOLO目标检测创新改进与实战案例专栏专栏目录:YOLO有效改进系列及项目实战目录包含卷积,主干注意力,检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例摘要卷积和自注意力是两个强大的表示学习技术,通常被认为是彼此独立的两......
  • 加油站AI智能视频监控分析系统 YOLOv8
    加油站AI智能视频监控分析系统可以根据视频总流量分析技术,使优化算法实体模型替代人的眼睛,加油站AI智能视频监控分析系统即时鉴别加油站内部的工作过程中的安全规范、员工行为准则等问题。加油站AI智能视频监控分析系统优化算法实体模型可以精确捕获违规操作,全年度24个小时无间......
  • YoloV8改进策略:Neck篇|自研Neck层融合模型|深度特征与浅层特征融合,涨点明显|附结构图(
    摘要本文介绍的独家原创的Neck层特征融合方法,将深度特征和浅层特征相融合,结合自研下采样模块和动态上采样模块,提供了一种高效的Neck层改进方式,不仅为他们提供了一个现成的解决方案,而且能够作为灵感启发,鼓励他们在此基础上进行进一步的探索和创新。即插即用的特性使得这种改......
  • 【下篇】从 YOLOv1 到 YOLOv8 的 YOLO 物体检测模型历史
    YOLO型号之所以闻名遐迩,主要有两个原因:其速度和准确性令人印象深刻,而且能够快速、可靠地检测图像中的物体。上回我解释了YoloX,今天从Yolov6开始。YOLOv6:面向工业应用的单级物体检测框架美团视觉人工智能事业部(MeituanVisionAIDepartment)于2022年9月在ArXiv上......
  • 【YOLOv8改进】CPCA(Channel prior convolutional attention)中的通道注意力,增强特征
    YOLO目标检测创新改进与实战案例专栏专栏目录:YOLO有效改进系列及项目实战目录包含卷积,主干注意力,检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例摘要医学图像通常展示出低对比度和显著的器官形状变化等特征。现有注意......