首页 > 编程札记 > 编程

COCO数据集训练TPH

阅读：评论：0

COCO数据集训练TPH

1.环境准备

设备：rtx 3060

环境要求：torch >= 1.8.1

其他环境按照源代码的readme安装即可

github地址：git clone

2.数据集准备

本文用COCO数据集来进行训练，TPH-YOLO作者给出了coco.yaml文件来进行coco数据集的训练，但为了与其他版本的Yolo进行兼容，我在这里使用了脚本，将coco格式的数据集转成了yolo的txt格式，即COCO转YOLO格式。

import os
import json
from tqdm import tqdm
import argparseparser = argparse.ArgumentParser()
# 这里根据自己的json文件位置，换成自己的就行
parser.add_argument('--json_path',default='xxx.json', type=str,help="input: coco format(json)")
# 这里设置.txt文件保存位置
parser.add_argument('--save_path', default='xxxx', type=str,help="specify where to save the output dir of labels")
arg = parser.parse_args()def convert(size, box):dw = 1. / (size[0])dh = 1. / (size[1])x = box[0] + box[2] / 2.0y = box[1] + box[3] / 2.0w = box[2]h = box[3]# round函数确定(xmin, ymin, xmax, ymax)的小数位数x = round(x * dw, 6)w = round(w * dw, 6)y = round(y * dh, 6)h = round(h * dh, 6)return (x, y, w, h)if __name__ == '__main__':json_file = arg.json_path  # COCO Object Instance 类型的标注ana_txt_save_path = arg.save_path  # 保存的路径data = json.load(open(json_file, 'r'))if not ists(ana_txt_save_path):os.makedirs(ana_txt_save_path)id_map = {}  # coco数据集的id不连续！重新映射一下再输出！with open(os.path.join(ana_txt_save_path, &#'), 'w') as f:# 写入for i, category in enumerate(data['categories']):f.write(f"{category['name']}n")id_map[category['id']] = i# print(id_map)# 这里需要根据自己的需要，更改写入图像相对路径的文件位置。list_file = open(os.path.join(ana_txt_save_path, &#'), 'w')for img in tqdm(data['images']):filename = img["file_name"]img_width = img["width"]img_height = img["height"]img_id = img["id"]head, tail = os.path.splitext(filename)ana_txt_name = head + ".txt"  # 对应的txt名字，与jpg一致f_txt = open(os.path.join(ana_txt_save_path, ana_txt_name), 'w')for ann in data['annotations']:if ann['image_id'] == img_id:box = convert((img_width, img_height), ann["bbox"])f_txt.write("%s %s %s %s %sn" % (id_map[ann["category_id"]], box[0], box[1], box[2], box[3]))f_txt.close()# 将图片的相对路径写入train2017或val2017的路径list_file.write('xxxxxxxx/%s.jpgn' % (head))list_file.close()

注：这个脚本参考CSDN其他博主的代码，是直接可用的，感谢他人的分享，链接我找不到了，如有不妥，请联系我删除。

3.文件配置

第一步，找到data文件夹下的coco.yaml,将nc、names改成你自己的分类数和类别标签（默认就是coco数据集的80，我用的自己的数据集），然后再把path,train,val,test改成自己的文件路径和txt路径。如果你使用自己的数据集或者已经下载了coco数据集，就把names下边的download内容全部注释。

第二步，找到model文件夹下的yolov5l-xs-tph.yaml文件，将第一个参数nc改成你的类别数（默认就是coco的80）

好了，修改到这，就可以按照readme中的运行命令进行运行了

第三步，修改train.py文件，为了python train.py运行指定程序

parser.add_argument('--weights', type=str, default=ROOT / 'yolov5l.pt', help='initial weights path')parser.add_argument('--cfg', type=str, default='/yolov5l-xs-tph.yaml', help='model.yaml path')parser.add_argument('--data', type=str, default=ROOT / 'coco.yaml', help='dataset.yaml path')parser.add_argument('--hyp', type=str, default=ROOT / 'data/hyps/hyp.scratch.yaml', help='hyperparameters path')parser.add_argument('--epochs', type=int, default=100)parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')parser.add_argument('--imgsz', '--img', '--img-size', type=int, default=640, help='train, val image size (pixels)')

这里主要修改weight、cfg、data文件，我选择固定的方式运行，也可以按照readme命令运行。

--hyp参数是超参数设置，可以不修改，也可以找到对应的文件进行调参。

参考：1.TPH-YOLO作者建议使用1536的图片尺寸进行训练，我在rtx 3060 上，bs设置为1，仍然爆显存，大家根据硬件调整吧；

2.自己数据集有5000张图片，用3060，img_size设置为768（1536的一半）bs设置为2，一个epochs需要25分钟。大家可以做一个时间参考。

4.测试

和yolo系列一样，在runs文件夹下有train文件夹来保存训练数据，测试时使用保存的最好的权重文件，使用detect.py文件测试即可，测试完毕在runs文件夹中会有detect的文件，保存测试结果。

5.swin-yolo正在跑，跑完就更新

欢迎交流！

本文发布于:2024-02-02 20:57:38，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/170687865846400.html

上一篇：【tph

下一篇：复现tph

标签：数据 COCO TPH

留言与评论（共有 0 条评论）