一、环境与工程
参考上一节:Swin Transformer做主干的 Faster RCNN 目标检测网络
使用的是同一个工程,环境无需再次配置。
二、Swin Transformer RetinaNet 网络代码
1. 修改configs/swin 目录下文件:retinanet_swin-t-p4-w7_fpn_1x_coco.py名字为retinanet_swin-t-p4-w7_fpn_3x_coco.py
修改文件内容如下:
注意:虽然这里面/base/models/ 使用的是 retinanet_r50_fpn.py,但是实际上这个文件的内容会对retinanet_r50_fpn.py 中定义的主干进行替换,当然你也可以新建一个文件,我就直接复用了改一下。
1 | _base_ = [ |
2. 修改 configs/base/models 目录下:retinanet_r50_fpn.py文件中的num_classes
将类被数改成自己数据集的类别数,当然也可以自己重新在上一步创建的retinanetswin-t-p4-w7_fpn_3x_coco.py文件中定义一下。
比如我使用的是四类,那么就把num_classes 改为4,其他部分不用改。
1 | bbox_head=dict( |
**3. 修改/_base/datasets/ 目录下的 coco_detection.py**
- img_scale 可根据自己的显存修改小一些,如:448* 448(两处需要修改),最好是224的倍数。
- batchsize 和 每个GPU的线程数(samples_per_gpu和workers_per_gpu 这两个参数),根据电脑配置调整。
- 数据集的路径也是在这配置
备注:当然如果怕修改后影响你训练其他模型的话,也可以直接自己新建一个,然后修改第一步创建的内容里面的 retinanet_swin-t-p4-w7_fpn_3x_coco.py base部分。
修改后的示例如下:
1 | # dataset settings |
三、数据集
数据集依然使用默认的coco格式,数据集制作参考数据集标注(LabelImg、LabelMe使用方法)
四、训练模型
直接执行: python tools/train.py configs/swin/retinanet_swin-t-p4-w7_fpn_3x_coco.py
注意:第一次执行会下载权值文件,需要等待一段时间,或者用特殊办法快点下载,权值文件会自动保存到你的电脑上,下次运行的时候就不再需要重新下载了,当然也可以和之前一样,提前下载好权值文件,然后配置一下。
五、测试训练效果
添加一个自己的图片在demo目录下,
执行:python demo/image_demo.py demo/000071.jpg configs/swin/retinanet_swin-t-p4-w7_fpn_3x_coco.py work_dirs/retinanet_swin-t-p4-w7_fpn_3x_coco/latest.pth
latest.pth 就是自己训练好的最新的权重文件,默认会放在workdir下。


把孤独当作晚餐
范茹
本文为作者原创文章,未经作者允许不得转载。