准备工作
- 安装依赖
确保你的开发环境中安装了必要的软件和库。YOLOv8是基于PyTorch框架的,因此你需要安装Python以及PyTorch。
安装Python(推荐3.7或更高版本)
安装PyTorch:你可以从PyTorch官方网站获取安装命令,根据你的系统配置选择合适的安装方式。
克隆YOLOv8的官方仓库到本地,并安装项目所需的其他依赖:
bash
深色版本
git clone https://github.com/ultralytics/ultralytics.git
cd ultralytics
pip install -r requirements.txt
2. 数据集准备
假设你的岩石数据集已经以YOLO格式准备好并且划分了训练集、验证集和测试集,那么接下来需要做的是将这些数据集放在正确的位置。通常,YOLOv8期望数据集结构如下:
深色版本
rock_dataset/
├── images/
│ ├── train/
│ ├── val/
│ └── test/
└── labels/
├── train/
├── val/
└── test/
每个文件夹中包含对应的图像文件和标签文件。确保所有图像文件都是.jpg格式,而标签文件是.txt格式,并且它们的名字与对应的图像文件相同。
- 配置文件
创建一个数据集配置文件(如rock_dataset.yaml),该文件定义了数据集的基本信息,包括路径、类别等。示例配置如下:
yaml
深色版本
训练和验证的数据集路径
train: rock_dataset/images/train
val: rock_dataset/images/val
测试集路径(可选)
test: rock_dataset/images/test
类别名称
names:
0: rock
如果有多个类别,继续添加
1: another_category
类别数量
nc: 1
开始训练
在完成上述准备工作后,你可以开始训练模型了。打开终端,进入YOLOv8项目的根目录,运行训练命令:
bash
深色版本
python ultralytics/yolo/v8/detect/train.py --data rock_dataset.yaml --cfg yolov8.yaml --weights yolov8x.pt --batch-size 16 --epochs 100
这里:
–data 参数指定了数据集配置文件的路径。
–cfg 参数指定了模型配置文件。
–weights 参数用于指定预训练权重的路径,这有助于加速训练过程并提高最终模型的性能。
–batch-size 和 --epochs 分别设置了批量大小和训练轮数。
模型评估
训练完成后,可以通过验证集来评估模型的性能。YOLOv8提供了方便的命令来进行模型评估:
bash
深色版本
python ultralytics/yolo/v8/detect/val.py --data rock_dataset.yaml --weights runs/train/exp/weights/best.pt
这里,best.pt 是训练过程中保存的最佳模型权重文件。
模型推理
你可以使用训练好的模型进行推理,检测新的图像中的岩石。示例命令如下:
bash
深色版本
python ultralytics/yolo/v8/detect/predict.py --source path/to/your/image.jpg --weights runs/train/exp/weights/best.pt --conf 0.25
这里:
–source 参数指定了要检测的图像路径。
–conf 参数设置了置信度阈值,低于该阈值的检测结果将被忽略。
注意事项
数据增强:为了提高模型的泛化能力,可以考虑使用数据增强技术,如随机裁剪、翻转、颜色抖动等。
超参数调整:根据训练过程中观察到的损失值和验证集上的性能,适当调整学习率、批量大小等超参数。
硬件资源:如果显存不足,可以减少批量大小或使用更小的模型变体。