Ubuntu 22.04 安装Nvidia驱动加速deepseek

news/2025/3/3 19:17:24/

一键安装22.04 nvidia 驱动

  • nvidia 官网下载驱动
  • 我的环境是NVIDIA RTX A5000
  • nvidia 文档参考
  • 没有安装驱动之前确认自己的型号 lspci | grep -i vga (如数字2231) 参考
  • docker 支持nvidia ,注释了需要的取消注释即可 42行-92行
  • 一定要重启服务器哦,不然驱动不会生效的reboot
vim /nvidia_install.sh
#!/bin/bash
# -*- coding: utf-8 -*-
# Author: CIASM
# update 2025/02/27
# make.ha<<!
# check nvidia
lspci | grep -i vga
http://pci-ids.ucw.cz/mods/PC/10de/2204#add-apt-repository ppa:graphics-drivers/ppa
!echo "remove nvidia"
apt remove -y nvidia*echo "add nvidia repo"
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
tee /etc/apt/sources.list.d/nvidia-container-toolkit.listecho "check host nvidia"
ubuntu-drivers devicesecho "install nvidia"
apt-get update
apt install -y nvidia-driver-535echo "install docker NVIDIA GPU"
apt install -y nvidia-container-toolkitecho "install NVIDIA CUDA Toolkit"
apt install -y nvidia-cuda-toolkitecho "nvidia persist mode"
nvidia-smi -pm 1# docker 支持 nvidia 配置
<<!
echo "docker daemon.json"
rm -rf /etc/docker/daemon.json 
cat <<'EOF'>>/etc/docker/daemon.json
{"registry-mirrors": ["https://registry.hub.docker.com","https://ccr.ccs.tencentyun.com","https://dockerproxy.com","https://hub-mirror.c.163.com","https://docker.mirrors.sjtug.sjtu.edu.cn","https://docker.nju.edu.cn","https://registry-k8s-io.mirrors.sjtug.sjtu.edu.cn","https://docker.m.daocloud.io","https://docker.mirrors.ustc.edu.cn","https://mirror.iscas.ac.cn","https://s64h8lpn.mirror.aliyuncs.com","https://atomhub.openatom.cn","https://mirror.baidubce.com","https://docker.1panel.live","https://proxy.1panel.live","https://image.cloudlayer.icu","https://docker-0.unsee.tech","https://docker.tbedu.top","https://pull.loridocker.com","https://docker.melikeme.cn","https://docker.imgdb.de","https://docker.hlmirror.com","https://docker.kejilion.pro","https://hub.rat.dev","https://dockerpull.pw","https://hub.fast360.xyz","https://docker.xuanyuan.me","https://docker.1ms.run","https://xdark.top","https://func.ink","https://lispy.org"],"insecure-registries": ["192.168.11.40"],"runtimes": {"nvidia": {"args": [],"path": "nvidia-container-runtime"}}
}
EOFecho "restart docker"
systemctl restart dockerecho "test cuda docker"
docker run --rm --gpus all nvidia/cuda:12.2.0-base-ubuntu22.04 nvidia-smi
!

一键安装nvidia 驱动

  • 一定要重启服务器哦,不然驱动不会生效的reboot
bash /nvidia_install.sh

 查询安装完成的nvidia驱动情况

nvidia-smi

nvidia 持续模式

  • 持久模式(-pm)允许用户将 NVIDIA-SMI 设置持久化,即使在系统重启后也能生效。这意味着,您可以在会话期间配置设备,而无需每次重新启动系统时都手动重新应用设置。
  • 1:启用持久模式
  • 0:禁用持久模式
  • 立即生效
echo "nvidia persist mode"
nvidia-smi -pm 1

nvidia ECC 校验开启和关闭

  • ECC(错误纠正代码)是一种用于检测和纠正设备内存错误的技术。启用 ECC 可以提高系统稳定性,防止因内存错误而导致的数据损坏。
  • 1:启用 ECC
  • 0:禁用 ECC
  • reboot 系统生效
nvidia-smi -e 1

重置 ECC 错误计数(-p) 

  • -p 选项用于重置 ECC 错误计数器。如果 ECC 已启用,此计数器将跟踪检测到的内存错误数量。重置计数器可以帮助您监测和排除故障,并确保您收到设备错误的最新信息。
  • 0/VOLATILE,
  • 1/AGGREGATE
nvidia-smi -p 0


http://www.ppmy.cn/news/1576355.html

相关文章

蓝桥杯2024年真题java B组 【H.拼十字】

蓝桥杯2024年真题java B组 【H.拼十字】 原题链接&#xff1a;拼十字 思路&#xff1a; 使用树状数组或线段树解决。 先将输入的信息存入到一个n行3列的数组中&#xff0c;将信息排序&#xff0c;按照长度小到大&#xff0c;长相同时&#xff0c;宽度小到大 排序。 建立三个…

安全见闻5,6

人工智能篇 人工智能目前处于高数发展阶段,所涉及的安全问题也很多 ai所收集的数据有泄露的风险(数据安全) ai进行工作的时候可能因为收集的恶意信息而产生错误(对抗攻击) ai模型被逆向窃取的风险,涉及到知识产权被侵犯的问题 ai被用作与恶意网络攻击的风险 同时要搞好ai…

命令行方式安装KFS同步KES到KADB

部署背景及环境 使用命令行方式同步KES的数据至KADB 操作系统 [mppadminmdw ~]$ uname -a Linux mdw 4.19.90-24.4.v2101.ky10.aarch64 #1 SMP Mon May 24 14:45:37 CST 2021 aarch64 aarch64 aarch64 GNU/Linux KFS版本 KingbaseFlySync-V002R002C004PS002-replicator.t…

线上服务器的文件下载到本地Windows电脑

将线上服务器的文件下载到本地Windows电脑&#xff0c;可以根据具体情况选择以下方法&#xff1a; 方法一&#xff1a;使用远程桌面连接&#xff08;推荐&#xff09; 开启远程桌面功能 确保服务器已启用远程桌面&#xff08;RDP&#xff09;服务&#xff0c;默认端口为3389。检…

【前端知识】Vue2.x与3.x之间的区别以及升级过程需要关注的地方

文章目录 Vue 2.x 与 Vue 3.x**Vue 2.x 与 Vue 3.x 的区别详细说明****1. 核心特性与性能****2. API 变化****3. 新增特性****4. 工具链与生态系统** **从 Vue 2 升级到 Vue 3 的注意事项****1. 检查依赖库兼容性****2. 修改代码以适配 Vue 3 的 API****3. 处理废弃功能****4. …

大模型推理时的尺度扩展定律

大模型推理时的尺度扩展定律 FesianXu at 20250212 at Wechat Search Team 前言 大模型的尺度扩展定律告诉我们&#xff1a;『LLM的性能会随着模型的参数量、模型的训练量、模型的训练数据量的增加而增加』。训练存在尺度扩展定律&#xff0c;测试也存在尺度扩展定律&#xff…

《Effective Objective-C》阅读笔记(下)

目录 内存管理 理解引用计数 引用计数工作原理 自动释放池 保留环 以ARC简化引用计数 使用ARC时必须遵循的方法命名规则 变量的内存管理语义 ARC如何清理实例变量 在dealloc方法中只释放引用并解除监听 编写“异常安全代码”时留意内存管理问题 以弱引用避免保留环 …

本地部署大语言模型-DeepSeek

DeepSeek 是国内顶尖 AI 团队「深度求索」开发的多模态大模型&#xff0c;具备数学推理、代码生成等深度能力&#xff0c;堪称"AI界的六边形战士"。 Hostease AMD 9950X/96G/3.84T NVMe/1G/5IP/RTX4090 GPU服务器提供多种计费模式。 DeepSeek-R1-32B配置 配置项 规…