The kernel appears to have died. It will restart automatically.

news/2024/11/23 22:58:30/

参考:https://github.com/tensorflow/tensorflow/issues/9829

出现这个错误的原因有很多,我这里只分享我遇到的这个错误原因。

 

在Jupyter中运行如下代码,报 kernel died 的错误。

# 加载模型
new_model = load_model('./saved_models/my_model.h5')def test_reprocess(img_path):img = cv2.imread(img_path)img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)img = np.expand_dims(img, axis=0)img = np.array(img)img = (1.0 * img) / 255return imgimg = test_reprocess('239.jpg')
print(new_model.predict(img))

 

原因是我运行了另一个python程序,使用tensorflow进行训练,占用了GPU的所有显存。

在这个程序中,上面代码的最后一行又想调用GPU,但是没有显存,所以就报错。

将另一个程序在jupyter中关闭(shutdown)就可以了。

 

同样的tensorflow显存的问题,在终端中执行python文件,报错如下:

tensorflow.python.framework.errors_impl.InternalError: Failed to create session.

raceback (most recent call last):File "/home/ejior/working/demo/test.py", line 12, in <module>new_model = load_model('/home/ejior/working/demo/saved_models/my_model.h5')File "/home/ejior/anaconda3/envs/tf/lib/python3.6/site-packages/keras/engine/saving.py", line 419, in load_modelmodel = _deserialize_model(f, custom_objects, compile)File "/home/ejior/anaconda3/envs/tf/lib/python3.6/site-packages/keras/engine/saving.py", line 287, in _deserialize_modelK.batch_set_value(weight_value_tuples)File "/home/ejior/anaconda3/envs/tf/lib/python3.6/site-packages/keras/backend/tensorflow_backend.py", line 2470, in batch_set_valueget_session().run(assign_ops, feed_dict=feed_dict)File "/home/ejior/anaconda3/envs/tf/lib/python3.6/site-packages/keras/backend/tensorflow_backend.py", line 186, in get_session_SESSION = tf.Session(config=config)File "/home/ejior/anaconda3/envs/tf/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 1563, in __init__super(Session, self).__init__(target, graph, config=config)File "/home/ejior/anaconda3/envs/tf/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 633, in __init__self._session = tf_session.TF_NewSession(self._graph._c_graph, opts)
tensorflow.python.framework.errors_impl.InternalError: Failed to create session.

 

可以在通过命令 nvidia-smi 查看显存使用情况:

(tf) ejior@ejior-XPS-8930:~$ nvidia-smi
Tue Jan 15 12:02:41 2019       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 415.25       Driver Version: 415.25       CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:01:00.0  On |                  N/A |
| 18%   42C    P2    70W / 250W |  10737MiB / 10986MiB |     33%      Default |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1046      G   /usr/lib/xorg/Xorg                           250MiB |
|    0     16027      C   ...e/ejior/anaconda3/envs/tf/bin/python3.6 10475MiB |
+-----------------------------------------------------------------------------+

对占用显存的进程kill掉就可以了。

 


http://www.ppmy.cn/news/495288.html

相关文章

docker安装detectron2

官方源码 I. docker安装 Ubuntu16.04 docker安装 II.nvidia-docker 安装Nvidia Docker2 III. 搭建环境 创建 docker 镜像 sudo docker build -t <image_name>:<tag> .&#xff08;请注意末尾的点号&#xff0c;代表当前目录&#xff09; 本人创建如下&#…

mmdetection安装和测试

第一步&#xff1a; 使用anaconda创建一个虚拟环境使其与系统主环境相隔离 conda create -n open-mmlab python3.7 -y source activate open-mmlab#激活刚才创建的open-mmlab虚拟环境 第二步&#xff1a; 在open-mmlab虚拟环境中安装pytorch 2.1 安装之前需要将清华的pyto…

ubuntu16.04安装搜狗输入法

第一步上搜狗输入法官网下载deb安装包 进入安装包路径&#xff0c;在终端输入 sudo dpkg -i *.deb #其中把*替换成你输入法安装包名字 执行效果如下&#xff1a; ~/Downloads$ sudo dpkg -i sogoupinyin_2.2.0.0108_amd64.deb [sudo] password for bubble: Selecting previ…

ubuntu matplotlib解决中文显示问题

步骤一 1.1 定位mpl-data所在位置&#xff0c;如下所示&#xff1a; bubbleXPS-8930:~$ locate -b \mpl-data /home/bubble/anaconda3/lib/python3.6/site-packages/matplotlib/mpl-data /home/bubble/anaconda3/pkgs/matplotlib-2.2.2-py36h0e671d2_1/lib/python3.6/site-pa…

Ubuntu 16.04安装anaconda3+pycharm+tensorflow-gpu详细教程

首先下载anaconda3镜像 清华大学开源软件镜像站下载地址&#xff1a; https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 下拉到最低端选择Linux&#xff0c;选择最新版&#xff08;32/64位&#xff09;下载。 在Terminal中执行以下命令&#xff1a; bash Anaconda3-…

mmdetection v2.0在ubuntu16.04服务器上的配置和训练自己的voc数据集

一.mmdetection环境搭建 系统环境&#xff1a; ubuntu16.04 cuda&#xff1a;10.0&#xff08;此处一定注意检查自己的环境&#xff0c;关乎到后面cudatoolkit版本的安装问题&#xff09; 默认大家都已经安装好 anaconda3 了&#xff0c;如果没有安装的&#xff0c;可以去官网…

mmdetection训练自己的数据集

一、准备数据集 准备自己的数据 mmdetection支持coco格式和voc格式的数据集&#xff0c;下面将分别介绍这两种数据集的使用方式 coco数据集 官方推荐coco数据集按照以下的目录形式存储&#xff0c;以coco2017数据集为例 mmdetection ├── mmdet ├── tools ├── con…

深度学习电脑环境配置

前几天新买的一台电脑&#xff0c;加显示器和其它配件&#xff0c;共计2.7万元多。 一、硬件及系统基本信息&#xff08;在dos命令中运行dxdiag查看&#xff09; 系统型号&#xff08;主板型号&#xff09;&#xff1a;XPS 8930 BIOS&#xff1a;1.0.10 处理器&#xff1a;…