查看和清除显存

news/2024/11/26 12:49:26/

深度学习训练过程中如果中断,很容易造成显存占用不释放的问题。做个记录,留着备用。

表现为报错:

tensorflow.python.framework.errors_impl.InternalError: CUDA runtime implicit initialization on GPU:0 failed. Status: out of memory

1.查看是否出现了问题:nvidia-smi

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.130                Driver Version: 384.130                   |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  TITAN V             Off  | 00000000:01:00.0  On |                  N/A |
| 39%   53C    P2    36W / 250W |  11959MiB / 12055MiB |      0%      Default |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1017      G   /usr/lib/xorg/Xorg                           298MiB |
|    0      1834      G   /opt/teamviewer/tv_bin/TeamViewer              6MiB |
|    0      2045      G   compiz                                       177MiB |
|    0      4118      G   ...-token=D609226DD6A56AEBB70B08FB7BC10F2E    78MiB |
|    0      4603      G   ...uest-channel-token=11061898972785214487    59MiB |
|    0     16481      C   python3                                      418MiB |
|    0     16537      C   python3                                    10916MiB |
+-----------------------------------------------------------------------------+

2.发现16537是罪魁祸首

 kill -9 16537

3.监控GPU:3代表3秒

watch -n 3 nvidia-smi

4.监控cpu和内存

 top -d 1

 free -m 

5.清除cache缓存内存空间

  1. sudo sh -c 'echo 1 > /proc/sys/vm/drop_caches'

  2. sudo sh -c 'echo 2 > /proc/sys/vm/drop_caches'

  3. sudo sh -c 'echo 3 > /proc/sys/vm/drop_caches'


http://www.ppmy.cn/news/409193.html

相关文章

linux下显卡信息的查看

lspci | grep -i vga 这样就可以显示机器上的显卡信息,比如 [rootlocalhost conf]# lspci | grep -i vga 01:00.0 VGA compatible controller: nVidia Corporation Device 1081 (rev a1) 02:00.0 VGA compatible controller: nVidia Corporation GT215 [GeForce…

如何查看显存大小

开始——运行,然后输入dxdiag,然后回车,然后切换到显示标签,然后看估计内存总数就是你的显存大小另:在桌面上点右键,属性-设置-高级,进入里面,点“适配器”,这些就是显卡…

怎么看显存及显卡型号

原文地址: http://zt.ijinshan.com/ws_zmkxk.shtml 摘要:我们经常在尝试新游戏的时候看到游戏对显卡的要求。而显卡作为电脑显示性能至关重要的部分,也经常需要进行驱动的安装和更新。这些都需要我们了解自己的显卡。那么怎么看显卡型号及显存…

Linux如何查看显存

(以下内容由参看资料总结而来,若有不对,望指出) 用ctrlaltt打开终端,输入命令:lspci,得到如下(部分): 00:1f.6 Signal processing controller: Intel Corporation 5 Ser…

查看显存和显卡

目录 查看显存1.window2.Linux 查看显卡1.window2.Linux 查看显存 1.window win键(窗口键)和R键,跳出运行窗口,在运行窗口输入dxdiag 2.Linux 输入命令 lspci或 lspci | grep -i vga得到如下结果 00:02.0 VGA compatible c…

easyui02(tree前端工作)

一.tree控件的使用 $(function(){ //加载树 $(#myTree).tree({ url:ctx/loadModuleServlet.do, onDblClick: function(node){ // alert(node.text); // 在用户点击的时候提示 //拿节点的子节点(…

[C++11] 智能指针

长路漫漫,唯剑作伴。 目录 长路漫漫,唯剑作伴。 为什么需要智能指针 RAII 使用RAII思想管理内存 重载 * 和-> 总结一下智能指针的原理: C的智能指针和拷贝问题 auto_ptr (C98) ​编辑 auto_ptr的实现原理…

20分钟做一套采购审批系统

1、设计输入模板 excel画表格界面 # 公式代表新建时以默认值代替 2、设置单元格为签名控件 双击单元格后,会默认显示当前用户的信息,用于签名 3、设置要合计的数据 生成的合计公式会默认放到下一行 4、设置单元格的ID与标题,在添加或者删除行或者列时&am…