详细错误如下:
RuntimeError: CUDA out of memory. Tried to allocate 32.00 MiB (GPU 1; 23.70 GiB total capacity; 21.69 GiB already allocated; 26.81 MiB free; 22.00 GiB reserved in total by PyTorch)
认真阅读这个错误后,就去查看了GPU 1,发现显存充足:
但是这里的显存充足,可能并不是真的充足,我每次查看显存时,都是在程序崩掉后,再nvidia-smi
,这时显示的已经是程序退出时的结果了,但我在程序运行的时候,再查看,发现:
这里显示的才是运行过程中某个时间点的显存
不过最后尝试把batch_size不断调小,调到10,仍然不行,猜想是数据集太庞大,可能要试试使用h import hvd
了,明天试试~
本文发布于:2024-01-29 05:54:03,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170647884413172.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |