【Docker】Docker 中不能使用 nvidia-smi

server/2024/9/23 19:41:05/

目录

1. 问题

2. 解决方法


1. 问题

docker 中执行 nvidia-smi 后报错:

Failed to initialize NVML: Unknown Error

这个错误表示不能成功初始化NVML(Nvidia Management Library)库来管理和监测Nvidia GPU。可能的原因和解决方法如下:

  • 检查是否正确安装并加载了Nvidia的驱动。需要安装对应GPU型号的驱动包。

  • 检查docker容器是否正确映射了Nvidia设备。需要使用"--runtime=nvidia"和"-gpus all"参数启动容器

  • 检查容器内是否安装了Nvidia的容器运行时(nvidia-container-runtime)包。

  • 检查主机与容器内部Linux内核版本是否兼容。需要主机和容器使用相同版本的内核。

  • 清除docker所有图像并重新构建容器。可能遗留的旧配置导致问题。

  • 重建docker服务,或重新启动Nvidia驱动。

  • 检查NVML本身是否损坏。可以尝试重新安装或者卸载后重新安装NVML相关依赖包。

  • 升级Nvidia驱动和硬件到最新版本,排除不兼容问题。

2. 解决方法

修改 docker 所在服务器的

 /etc/nvidia-container-runtime/config.toml

中的参数为

no-cgroups = false


http://www.ppmy.cn/server/17959.html

相关文章

python爬虫学习------scrapy第二部分(第三十天)

🎈🎈作者主页: 喔的嘛呀🎈🎈 🎈🎈所属专栏:python爬虫学习🎈🎈 ✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天…

基于STM32实现流水灯【Proteus仿真】

详情更多 wechat:嵌入式工程师成长日记 https://mp.weixin.qq.com/s?__bizMzg4Mzc3NDUxOQ&mid2247485624&idx1&sn4e553234c2624777409bd2067a07aad8&chksmcf430de0f83484f6189b119d9d83ea6e6f2a85d13afaa04d218483918231c38e6382d3007061&tok…

Godot3D学习笔记1——界面布局简介

创建完成项目之后可以看到如下界面: Godot引擎也是场景式编程,这里的一个场景相当于一个关卡。 这里我们点击左侧“3D场景”按钮创建一个3D场景,现在在中间的画面中会出现一个球。在左侧节点视图中选中“Node3D”,右键创建子节点…

9【PS作图】像素画Tips

放大缩小 “窗口”-排列-为…画布新建窗口,就可以新建一个窗口,实时看作图效果 如果要保持放大或缩小的像素画仍然保持硬边缘,需要设置两个东西 将 编辑 > 首选项 > 常规 中的 插值方式 改为 “邻近(靠近硬边缘&#xff09…

网络安全-态势感知

网络安全态势感知是一种对网络安全性定量分析的一种手段,成已经为网络安全2.0时代安全技术的焦点,对保障网络安全起着非常重要的作用。 为什么需要态势感知 态势感知的概念最早在军事领域被提出,覆盖了感知、理解和预测三个层次。并随着网络…

酷开科技逐步为用户构建健全的智慧家庭生活场景

大规模与精细化人群技术则是通过大量的计算能力和精细化的运营能力,建立用户专属数据储存区域,使得用户在使用不同电视的观影偏好和兴趣能够能够得以延续。 不拘泥于自有品牌终端数量,酷开系统除了集成在创维电视上,还服务于飞利…

python高级进阶(四)[模块、包、异常]

目录 一、模块module 1.1 模块module 1.2 创建模块文件 1.3 导入模块中的gongn 1. 导入整个模块 2. 导入模块中的特定功能 3. 导入模块中的所有功能(不推荐,因为可能会导致命名冲突 1.4 模块导入冲突 1. 部分导入冲突 2. 全部导入冲突 1.5 3. 模…

bit、进制、位、时钟(窗口)、OSI七层网络模型、协议、各种码

1.bit与进制 (个人理解,具体电路是非常复杂的) 物理层数据流,bit表示物理层数据传输单位, 一个电路当中,通过通断来表示数字1和0 两个电路要通讯,至少要两根线,一根作为电势参照…