巨坑!如果你cuda是11.1而cuda toolkit是9.2,导致无法安装apex,同时你还没有服务器权限去换驱动

news/2024/12/22 20:37:32/

非常奇葩的问题。gpu是3090,cuda是正常的11.1,但是nvcc -V输出的却是9.2。

本来很简单,重新安装一下,把两个版本对齐了就好了,但是我用的是实验室的服务器,我是没有权限去在系统上安装东西的,连apt-get都用不了。

最后终于解决了,其实不需要重新安装,你的nvidia-smi显示正常,平常运行代码也正常,说明你的cuda本来就是正常的,只不过是系统文件识别的时候没有识别正确的版本。改一下文件,链接到正确的版本就好了。

原文是sudo gedit ~/.bashrc,但是我没权限gedit,改用vim居然可以。

所以vim ~/.bashrc,按 i 进入编辑模式,然后在末尾加上(注意去你路径里看看有没有这些目录)

export CUDA_HOME="/usr/local/cuda-11.1/"
export LD_LIBRARY_PATH="/usr/local/cuda-11.1/lib64/"
export PATH="/usr/local/cuda-11.1/bin:$PATH"

然后按 esc,输入 wq 回车,这样就保存了。

然后source ~/.bashrc

做完这一切之后,再回去apex文件夹,执行python setup.py install --cuda_ext --cpp_ext


这一部分是自录,跟本问题无关。上面这些做完之后,重启conda环境,使用nvcc -V应该是能看到cuda变成11.1的。但是现在去运行工程,还是会报错。

我记得好像是什么kernal no image什么的,总之上网一查,全部都说是pytorch和gpu的版本不搭。但是我这个pytorch之前是用过的,实测没问题,而且跟cuda去查了也是搭的,跟gpu也是搭的。

最后还是重装了pytorch,去那个stable网页下载whl文件,安装后,再把apex、secen_graph_benchmark都重新编译一遍,然后重启终端。

终于可以了,重装重启解决90%的问题。


http://www.ppmy.cn/news/46772.html

相关文章

TensorFlow 2.0 的新增功能:第一、二部分

原文:What’s New in TensorFlow 2.0 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 深度学习 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 不要担心自己的形象,只关心如何实现目…

慌了!ChatGPT吃我饭,还要掀我碗?

ChatGPT面世,各种被AI取代“失业言论”笼罩在人们头顶,本文聚焦这一问题,推荐关注ChatGPT的小伙伴阅读。 一时间火爆全网的新晋网红——ChatGPT,就问:还有谁不认识? 谷歌计划在旗舰搜索引擎中添加对话式人…

Java——合并两个排序的链表

题目链接 牛客在线oj题——合并两个排序的链表 题目描述 输入两个递增的链表,单个链表的长度为n,合并这两个链表并使新链表中的节点仍然是递增排序的。 数据范围: 0≤n≤1000,−1000≤节点值≤1000 要求:空间复杂…

ES X-Pack密码认证与用户管理

用户数据的安全性一直被人诟病且默认没有密码认证,Elasticsearch在6.8之前官方的X-pack安全认证功能都是收费的,所以很多人都采用Search Guard或者ReadOnly REST这些免费的安全插件对Elasticsearch进行安全认证。从Elasticsearch 6.8开始,Sec…

亚马逊的四大流量来自哪里?

一、排行榜流量 在Amazon中,影响排行榜流量的主要因素一般有这几种: 销售排行榜:这个排行榜是与销售和好评挂钩,不仅要销量好,好评也要多,所以要尽量让买家留下好的评价,这对排名的提升帮助很…

docker命令

1.运行 docker-compose up 2.查看命令 docker images 3.删掉docker镜像: docker rmi -f [id] docker卸载 1.杀死docker有关的容器: docker kill $(docker ps -a -q) 2.删除所有docker容器:docker rm $(docker ps -a -q) 3.删除所有docker镜像&…

车企外卷:一个关于智能手机的“围城故事”

从2016年达到顶峰开始,全球智能手机出货量逐年下行,手机市场进入红海竞争逐渐成为了各界的共识。此后全球疫情与经济疲软的影响也进一步在手机市场施压,很多媒体认为手机产业距离“至暗时刻”已经不远。 而在去年,新增变数&#x…

《剪花布条》:从花布条中尽可能剪出几块小饰条

目录 一、题目 二、思路 1、代码中要使用的String类中的方法 (1)判断 s 中是否有 t (2)将 s 分割 2、递归判断 三、代码 详细注释版本 简化注释版本 一、题目 题目:剪花布条 题目链接&#xf…