显卡显存充足,但是报错:CUDA error: out of memory

阅读: 评论:0

显卡显存充足,但是报错:CUDA error: out of memory

显卡显存充足,但是报错:CUDA error: out of memory

1. 问题描述

显卡未显存充足,且无进程占用,使用 nvidia-smi 和 sudo fuser -v /dev/nvidia* 均找不到占用进程。

 报错:

RuntimeError: CUDA error: out of memory CUDA kernel errors might be asynchronously reported at some 

2. 解决方案

2.1 清理未释放缓存(未奏效)

import torch# 使用`pty_cache()`函数释放CUDA失活显存
pty_cache()# 查看GPU使用情况
print(_allocated())
print(_reserved())

2.2 重启device(未奏效)

from numba import cuda
device = _current_device()
set()
cuda.close()

报错:仍然是OOM问题

 2.3 重启device(奏效)!!!

 先试用 sudo fuser -v /dev/nvidia* 查看占用程序pid,kill掉之后执行下面的命令重启对应的显卡。

nvidia-smi --gpu-reset -i $gpu_id

2.4 重启解决,但不推荐

参考链接:

1. GPU memory is empty, but CUDA out of memory error occurs - CUDA / CUDA Programming and Performance - NVIDIA Developer Forums

本文发布于:2024-01-29 05:54:21,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170647886413174.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:显存   报错   充足   显卡   memory
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23