1、请首先检查自己是不是没有将原来的模型参数成功导入
2、如果训练时一直不变,注意应该加载模型参数前就定义优化器
参考【python模型保存之后,再恢复训练如何做】_权侑莉老婆的博客-CSDN博客
3、加载后准确率很低,尤其是测试验证集准确率时准确率都很低,多半是因为标签问题。
先要检查自己的标签是否是固定的,可能会出现两次训练标签不一致的情况。
4、想要继续训练时,完全与之前保持相同的走势,需要加载优化器参数、步长scheduler、epoch,可参考PyTorch实现断点继续训练 - 知乎
5、构造optim对象时可以先做好模型的cuda()操作(这个我认为不一定,但是可以参考)
Pytorch 深度学习 模型训练 断点继续训练时损失函数恶化或与断点差异较大_周博士的博客-CSDN博客
6、测试图片时记得把模型调成eval()模型
7、如果要放到多gpu上训练,使用parallel.DistributedDataParallel前一定要加载好模型参数,(因为DDP后模型参数都加上了modules,这样加载参数时如果使用strict=False就自动没有加载了)
本文发布于:2024-02-02 22:16:35,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170688339346801.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |