基于ubuntu22.04系统安装nvidia A100驱动与NVLink启用

news/2025/2/11 9:52:41/

1、官方仓库
针对驱动包下载认准nvidia官网
在这里插入图片描述

dpkg -i nvidia-driver-local-repo-ubuntu2204-550.54.15_1.0-1_amd64.deb
apt update
apt search nvidia-driver-550

2、安装
根据步骤1apt search nvidia-driver-550查出版本:此驱动包封在nvidia-driver-local-repo-ubuntu2204-550.54.15_1.0-1_amd64.deb中
apt install nvidia-driver-550
至此nvidia-smi PCIe通信方式已可用
nvidia-smi topo -m查看 GPU卡连接方式

3、启用NVLink高速模式
NVLink是GPU服务器厂家专为GPU间高效通信定制的连接,有硬件接口支持,比一般的PCIe速度快2倍以上。

apt install cuda-drivers-fabricmanager-550
apt install nvidia-modprobesystemctl start nvidia-fabricmanager.service
systemctl status nvidia-fabricmanager.service 查看启动服务是否正常
nvidia-smi topo -m查看 GPU卡连接方式已变成NVLink

4、附:涉及的nvidia包
注意看版本比较统一:都是从本地仓库获取的550版本

dpkg -l | grep nvidia
ii  libnvidia-cfg1-550:amd64                      550.54.15-0ubuntu1                      amd64        NVIDIA binary OpenGL/GLX configuration library
ii  libnvidia-common-550                          550.54.15-0ubuntu1                      all          Shared files used by the NVIDIA libraries
ii  libnvidia-compute-550:amd64                   550.54.15-0ubuntu1                      amd64        NVIDIA libcompute package
ii  libnvidia-decode-550:amd64                    550.54.15-0ubuntu1                      amd64        NVIDIA Video Decoding runtime libraries
ii  libnvidia-encode-550:amd64                    550.54.15-0ubuntu1                      amd64        NVENC Video Encoding runtime library
ii  libnvidia-extra-550:amd64                     550.54.15-0ubuntu1                      amd64        Extra libraries for the NVIDIA driver
ii  libnvidia-fbc1-550:amd64                      550.54.15-0ubuntu1                      amd64        NVIDIA OpenGL-based Framebuffer Capture runtime library
ii  libnvidia-gl-550:amd64                        550.54.15-0ubuntu1                      amd64        NVIDIA OpenGL/GLX/EGL/GLES GLVND libraries and Vulkan ICD
ii  nvidia-compute-utils-550                      550.54.15-0ubuntu1                      amd64        NVIDIA compute utilities
ii  nvidia-dkms-550                               550.54.15-0ubuntu1                      amd64        NVIDIA DKMS package
ii  nvidia-driver-550                             550.54.15-0ubuntu1                      amd64        NVIDIA driver metapackage
ii  nvidia-driver-local-repo-ubuntu2204-550.54.15 1.0-1                                   amd64        nvidia-driver-local repository configuration files
ii  nvidia-fabricmanager-550                      550.54.15-1                             amd64        Fabric Manager for NVSwitch based systems.
ii  nvidia-firmware-550-550.54.15                 550.54.15-0ubuntu1                      amd64        Firmware files used by the kernel module
ii  nvidia-kernel-common-550                      550.54.15-0ubuntu1                      amd64        Shared files used with the kernel module
ii  nvidia-kernel-source-550                      550.54.15-0ubuntu1                      amd64        NVIDIA kernel source package
ii  nvidia-modprobe                               550.54.15-0ubuntu1                      amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-prime                                  0.8.17.1                                all          Tools to enable NVIDIA's Prime
ii  nvidia-settings                               550.54.15-0ubuntu1                      amd64        Tool for configuring the NVIDIA graphics driver
ii  nvidia-utils-550                              550.54.15-0ubuntu1                      amd64        NVIDIA driver support binaries
ii  screen-resolution-extra                       0.18.2                                  all          Extension for the nvidia-settings control panel
ii  xserver-xorg-video-nvidia-550                 550.54.15-0ubuntu1                      amd64        NVIDIA binary Xorg driver

http://www.ppmy.cn/news/1412766.html

相关文章

Linux之线程控制

对页表的再次理解(以32位为例) 并不是只有一个页表, 地址的前10位对应一级页表,地址的第11-20位对应二级页表,后12位为页内偏移,其实内存和磁盘中的文件,都被分成了以4KB为单位的区域&#xff0…

信息系统项目管理师——第5章信息系统工程(一)

近几期的考情来看,本章选择题稳定考4分,考案例的可能性有,需要重点学习。本章节专业知识点特别多。但是,只考课本原话,大家一定要把本章至少通读一遍,还要多刷题,巩固重点知识。 1 软件工程 软…

q @ k运算及att = (q @ k.transpose(-2, -1))含义

以下代码经常在Transformer的算法中见到:q, k, v qkv[0], qkv[1], qkv[2] # query, key, value tensor q q * self.scale attn (q k.transpose(-2, -1))其中涉及到a b操作和transpose操作 a torch.Tensor([[1,2],[3,4]]) print(a)b torch.Tensor([[0.5,2],[…

23 种设计模式详解(3.7万字带你了解设计模式)

​ 设计模式 一,介绍 设计模式的分类 设计模式分为三大类: 创建型模式,共五种:工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。 结构型模式,共七种:适配器模式、装饰器模式、代理模式、…

node后端上传文件到本地指定文件夹

实现 第一步,引入依赖 const fs require(fs) const multer require(multer) 第二步,先设置一个上传守卫,用于初步拦截异常请求 /*** 上传守卫* param req* param res* param next*/ function uploadFile (req, res, next) {// dest 值…

《QT实用小工具·十五》多种样式的开关控件

1、概述 源码放在文章末尾 目前实现了三种样式的开关控件按钮&#xff0c;如下所示&#xff1a; 项目部分代码如下所示&#xff1a; #ifndef IMAGESWITCH_H #define IMAGESWITCH_H/*** 图片开关控件 * 1. 自带三种开关按钮样式。* 2. 可自定义开关图片。*/#include <QWid…

OneFlow:为什么这个深度学习框架能够颠覆市场?

一、介绍OneFlow深度学习框架 OneFlow是由一个旨在提高深度学习训练和推理效率的开源框架&#xff0c;它由中科院计算所在2020年11月正式开源。OneFlow充分利用了最新的硬件和软件技术&#xff0c;在提供出色性能的同时保持代码简洁性和易用性。 下面我们将从以下三个方面介绍…

电商技术揭秘十七:浅析电商数据安全与保护

相关系列文章 电商技术揭秘一&#xff1a;电商架构设计与核心技术 电商技术揭秘二&#xff1a;电商平台推荐系统的实现与优化 电商技术揭秘三&#xff1a;电商平台的支付与结算系统 电商技术揭秘四&#xff1a;电商平台的物流管理系统 电商技术揭秘五&#xff1a;电商平台…