【人工智能】实验室GPU资源申请使用

embedded/2024/10/18 12:25:40/

实验室独占实例Ubuntu 20.04 配置 Pytorch GPU

一、换源

1. 备份原来的文件
sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup
2. 编辑vi /etc/apt/sources.list文件
vim /etc/apt/sources.list
3. 将内容全部替换为下面
# 默认注释了源码镜像以提高 apt update 速度,如有需要可自行取消注释
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-updates main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-updates main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-backports main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-backports main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-security main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-security main restricted universe multiverse
4. 更新软件
sudo apt-get update

二、安装 anaconda

1. 去官网登录、下载 官网链接

在这里插入图片描述

2. 将下载的文件 Anaconda3-2024.06-1-Linux-x86_64.sh 文件上传到服务器,并在该目录下执行下面代码,一路回车
bash Anaconda3-2024.06-1-Linux-x86_64.sh
3. 创建conda虚拟环境
conda create -n pytorch241 python=3.10.0

pytorch241 为环境名,自己随便取,python 版本根据要安装的pytorch要求指定。pytorch 官网 有每个pytorch的最低python版本要求。

如果报错conda找不到,vim ~/.bashrc,将export PATH=$PATH:/home/vincent/anaconda3/bin添加到末尾,再进行刷新source ~/.bashrc

4. 初始化conda环境
conda init
5. 切换到刚才建立的环境
conda activate pytorch241

pytorch241 自己创建的虚拟环境名

三、安装 pytorch

1. 检查显卡信息
 nvidia-smi

如果显示下面图图片,说明显卡安装没问题,右上角CUDA Version 为显卡支持CUDA最高版本,也就是说过会安装pytorch的时候,cuda版本不能超过这个。
在这里插入图片描述

否则就需要自己安装显卡驱动

确认自己电脑安装了NVIDIA显卡:lspci | grep -i nvidia
查看合适的版本:ubuntu-drivers devices
安装带recomended标记的显卡驱动(别安装带open的):sudo apt install nvidia-driver-535(如果提示 sudo 找不到 condavim ~/.bashrc 在最后添加 alias sudo="sudo env PATH=$PATH",再执行source ~/.bashrc)

2. 打开pytorch官网 官网链接,选择合适的配置

在这里插入图片描述

执行下面代码的时候要确保已经激活刚才新建的anaconda环境
在这里插入图片描述
如果还没激活,请执行conda activate pytorch241pytorch241为自己新建的环境名。

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
3. 验证是否安装成功

打开 python:python
导入 torch:import torch
查看GPU是否可用:print(torch.cuda.is_available()),如果返回TRUE,则GPU版安装成功。
在这里插入图片描述

实验室共享性实例

一、申请实例

1. 申请cpu节点
salloc

salloc 将会分配一个cpu,该语句执行后将会返回cpu编号,我申请返回cpu1

请特别注意,不要在workstation进行其他操作,在cpu、gpu节点进行操作。

2. 切换到CPU节点
ssh cpu1
3. 申请GPU资源
salloc -p gpu-rtx3080ti -N1 -n1 --gres=gpu:1 -t 30-24:00:00

-p gpu-rtx3080ti:表示申请的要申请的分区为gpu-rtx3080ti
-N1:代表申请1个节点
-n1:代表申请1块GPU
–gres=gpu:1:代表每个节点申请1块GPU
-t 30-24:00:00:代表最大占用时间为30天24小时0分0秒
申请成功会返回GPU编号,我申请到的GPU编号为gpu10

4. 切换掉GPU节点
ssh gpu10

接下来就可以在GPU节点安装anaconda、pytorch GPU等。


http://www.ppmy.cn/embedded/128448.html

相关文章

文本生成视频技术:艺术与科学的交汇点

在人工智能技术的飞速发展下,文本生成视频(Text-to-Video)技术已经成为现实。这项技术能够根据文本描述生成相应的视频内容,极大地拓展了内容创作的边界。本文将从三个主要方面对文本生成视频技术进行深入探讨:技术能达…

白炽灯有频闪为什么最护眼?孩子用的台灯哪个牌子好你知道吗?

在当今社会,随着电子产品的普及与长时间的学习需求,保护视力成为了家庭关注的重点之一。而关于照明设备的选择,市场上存在各种说法与推荐,其中一种观点认为,尽管白炽灯存在频闪现象,它却因为接近自然光的变…

【Kubernets】配置类型资源 Etcd, Secret, ConfigMap

文章目录 所有资源概览Etcd详细说明一、基本概念二、主要功能三、架构与组件四、数据模型与操作五、安全与认证六、集群部署与管理 Secret详细说明一、Secret 的类型二、Secret 的创建三、Secret 的使用四、Secret 的更新与删除五、Secret 的安全性 ConfigMap详细说明一、Confi…

OpenCV高级图形用户界面(6)获取指定窗口中图像的矩形区域函数getWindowImageRect()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 提供窗口中图像的矩形区域。 该函数 getWindowImageRect 返回图像渲染区域的客户端屏幕坐标、宽度和高度。 函数原型 Rect cv::getWindowImage…

【论文速读】Prefix-Tuning: Optimizing Continuous Prompts for Generation

arxiv:2101.00190v1 摘要 微调实际上是利用大型预训练过的语言模型来执行下游任务的一种方法。但是,它会修改所有的语言模型参数,因此需要为每个任务存储一个完整的副本。在本文中,我们提出了Prefix-Tuning(前缀调优…

Linux手账—exec和fork

希望你开心,希望你健康,希望你幸福,希望你点赞! 最后的最后,关注喵,关注喵,关注喵,大大会看到更多有趣的博客哦!!! 喵喵喵,你对我真的…

GitHub生成SSH密钥,

GitHub会通过SSH密钥来验证你的身份,确保你有权限克隆、推送或拉取代码。 对于公开仓库,你不需要额外的权限,只需确保SSH密钥已正确配置并可以通过GitHub验证。公开仓库允许任何人克隆,即使仓库属于他人,只要你通过SS…

K-means 算法、层次聚类、密度聚类对鸢尾花(Iris)数据进行聚类

目录 1.基础知识 1.1 K-Means 算法 1.2 层次聚类(Hierarchical Clustering) 1.3 密度聚类(DBSCAN) 1.4 距离和相似度度量方法 1.5 总结: 2.K-means 算法对鸢尾花(Iris)数据进行聚类 2.1…