设备:rtx 3060
环境要求:torch >= 1.8.1
其他环境按照源代码的readme安装即可
github地址:git clone
本文用COCO数据集来进行训练,TPH-YOLO作者给出了coco.yaml文件来进行coco数据集的训练,但为了与其他版本的Yolo进行兼容,我在这里使用了脚本,将coco格式的数据集转成了yolo的txt格式,即COCO转YOLO格式。
import os
import json
from tqdm import tqdm
import argparseparser = argparse.ArgumentParser()
# 这里根据自己的json文件位置,换成自己的就行
parser.add_argument('--json_path',default='xxx.json', type=str,help="input: coco format(json)")
# 这里设置.txt文件保存位置
parser.add_argument('--save_path', default='xxxx', type=str,help="specify where to save the output dir of labels")
arg = parser.parse_args()def convert(size, box):dw = 1. / (size[0])dh = 1. / (size[1])x = box[0] + box[2] / 2.0y = box[1] + box[3] / 2.0w = box[2]h = box[3]# round函数确定(xmin, ymin, xmax, ymax)的小数位数x = round(x * dw, 6)w = round(w * dw, 6)y = round(y * dh, 6)h = round(h * dh, 6)return (x, y, w, h)if __name__ == '__main__':json_file = arg.json_path # COCO Object Instance 类型的标注ana_txt_save_path = arg.save_path # 保存的路径data = json.load(open(json_file, 'r'))if not ists(ana_txt_save_path):os.makedirs(ana_txt_save_path)id_map = {} # coco数据集的id不连续!重新映射一下再输出!with open(os.path.join(ana_txt_save_path, '), 'w') as f:# 写入for i, category in enumerate(data['categories']):f.write(f"{category['name']}n")id_map[category['id']] = i# print(id_map)# 这里需要根据自己的需要,更改写入图像相对路径的文件位置。list_file = open(os.path.join(ana_txt_save_path, '), 'w')for img in tqdm(data['images']):filename = img["file_name"]img_width = img["width"]img_height = img["height"]img_id = img["id"]head, tail = os.path.splitext(filename)ana_txt_name = head + ".txt" # 对应的txt名字,与jpg一致f_txt = open(os.path.join(ana_txt_save_path, ana_txt_name), 'w')for ann in data['annotations']:if ann['image_id'] == img_id:box = convert((img_width, img_height), ann["bbox"])f_txt.write("%s %s %s %s %sn" % (id_map[ann["category_id"]], box[0], box[1], box[2], box[3]))f_txt.close()# 将图片的相对路径写入train2017或val2017的路径list_file.write('xxxxxxxx/%s.jpgn' % (head))list_file.close()
注:这个脚本参考CSDN其他博主的代码,是直接可用的,感谢他人的分享,链接我找不到了,如有不妥,请联系我删除。
第一步,找到data文件夹下的coco.yaml,将nc、names改成你自己的分类数和类别标签(默认就是coco数据集的80,我用的自己的数据集),然后再把path,train,val,test改成自己的文件路径和txt路径。如果你使用自己的数据集或者已经下载了coco数据集,就把names下边的download内容全部注释。
第二步,找到model文件夹下的yolov5l-xs-tph.yaml文件,将第一个参数nc改成你的类别数(默认就是coco的80)
好了,修改到这,就可以按照readme中的运行命令进行运行了
第三步,修改train.py文件,为了python train.py运行指定程序
parser.add_argument('--weights', type=str, default=ROOT / 'yolov5l.pt', help='initial weights path')parser.add_argument('--cfg', type=str, default='/yolov5l-xs-tph.yaml', help='model.yaml path')parser.add_argument('--data', type=str, default=ROOT / 'coco.yaml', help='dataset.yaml path')parser.add_argument('--hyp', type=str, default=ROOT / 'data/hyps/hyp.scratch.yaml', help='hyperparameters path')parser.add_argument('--epochs', type=int, default=100)parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')parser.add_argument('--imgsz', '--img', '--img-size', type=int, default=640, help='train, val image size (pixels)')
这里主要修改weight、cfg、data文件,我选择固定的方式运行,也可以按照readme命令运行。
--hyp参数是超参数设置,可以不修改,也可以找到对应的文件进行调参。
参考:1.TPH-YOLO作者建议使用1536的图片尺寸进行训练,我在rtx 3060 上,bs设置为1,仍然爆显存,大家根据硬件调整吧;
2.自己数据集有5000张图片,用3060,img_size设置为768(1536的一半)bs设置为2,一个epochs需要25分钟。大家可以做一个时间参考。
和yolo系列一样,在runs文件夹下有train文件夹来保存训练数据,测试时使用保存的最好的权重文件,使用detect.py文件测试即可,测试完毕在runs文件夹中会有detect的文件,保存测试结果。
5.swin-yolo正在跑,跑完就更新
欢迎交流!
本文发布于:2024-02-02 20:57:38,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170687865846400.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |