autoDL上A100运行wiki出错:NVIDIA A100-PCIE-40GB(最后安装好torch+dgl了);学校服务器加2.X版本pytorch

news/2024/10/18 20:12:16/

1、A100运行wiki出错:NVIDIA A100-PCIE-40GB with CUDA capability sm_80 is not compatible with the current PyTorch installation.
The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_70.
If you want to use the NVIDIA A100-PCIE-40GB GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/

A100 报错:

 参考:

python - 如何将 Pytorch (+cuda) 与 A100 GPU 一起使用?- 堆栈溢出 (stackoverflow.com)

本来打算这样解决,但是不行:( torchvision==0.12.0+cu113是我自己添加的

pip install torch==1.11.0+cu113  torchvision==0.12.0+cu113 -f https://download.pytorch.org/whl/torch_stable.html

 

1.1 然后, 我的实际操作——A100安装pytorch2.X版本(失败):

PyTorch

conda activate pya100nvcc --versionconda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch -c nvidia

  (这个也是不行)

1.2 继续换一个操作成功了:

写文章-CSDN创作中心  首先把conda这些配置好,然后:

 pip install torch==1.11.0+cu113 -f https://download.pytorch.org/whl/torch_stable.html

1.3  安装好pytorch1.11.0+cuda113之后,安装dgl:

dgl安装包放在这个位置

 然后在root下conda list,就有了。

 这里只尝试运行一半:2000个epoch(毕竟一小时4块钱呀,贵啊)

总结:在学校服务器用torch1.12+cuda没问题,但是autoDL服务器就不行。

所以建议autoDL服务器就用作者给定的torch1.11+cuda113+dgl0.9

 (     autoDL上在3090上用torch2.X的话:

下载torch:

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

下载dgl: 

conda install -c dglteam/label/cu117 dgl   

学校服务器用pip安装;autoDL服务器用conda安装)

2、学校服务器加2.X版本pytorch

2.1 conda一个环境

2.2 安装pytorch2.X版本

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

2.3 安装dgl:

pip install  dgl -f https://data.dgl.ai/wheels/cu118/repo.html


http://www.ppmy.cn/news/488276.html

相关文章

Windows 查看端口占用情况 80端口被占用处理方法

一 . 用netstat指令查看是端口占用情况 查看所有端口的占用情况 C:\Users\Administrator>netstat -ano 活动连接协议 本地地址 外部地址 状态 PIDTCP 0.0.0.0:21 0.0.0.0:0 LISTENING 2228TCP 0.0.0.0:8…

数据库原理之数据库事物

文章目录 一、事物介绍1.1 事物的目的是保证数据的一致性1.2 事物的ACID A、I、D是为了实现 C1.3 什么是本地事物(Local Transactions) 二、数据库系统如何实现ACID2.1 影响深远的ARIES理论2.2 本地事物如何实现原子性和持久性 A、D2.2.1 实现原子性和持久性的Commit Logging方…

每日一坑:加载DLL失败:找不到指定模块

调用dll库,报错。找不到指定模块 以为是路径没对,找不到调用的这个库,打印输出了好几遍加载路径,都没发现哪里有问题,路径也没有出现乱码。 突然灵光一现: 被调用的这个库(A)&…

模块msvcp140.dll加载失败怎么解决

参考:https://zhidao.baidu.com/question/1050601731729664579.html

达梦加密模块加载失败

使用相应Qt版本的libeay32.dll、ssleay32.dll

dll注册加载失败解决方法,请确保二进制的解决办法(无数踩坑试出来的)

两部 现在的win10一般都这么操作 先把dll放在system32中 再复制一份到sysWOW64中 再打开"开始-运行-输入regsvr32 dll",回车即可解决。

msxml4.dll加载失败、动态链接库例程失败

背景: 用户使用我们行业软件,打开程序出现:msxml4.dll加载失败,程序退出! 故障系统: XP 解决方案: ①从互联网上下载msxml4.dll文件,放至对应目录,XP为:C:\…