训练模型时报下面错误:
could not load library libcudnn_cnn_train.so.8
出现错误的可能原因:
PyTorch 有自己的 CUDA 依赖项(包括 cuDNN),所以需要从库路径中移除本地安装的 cuDNN,让 PyTorch 加载它自己的库。
如果想使用本地安装的 CUDA 工具包,可以从源代码构建 PyTorch。
解决方法之一:
cd /usr/local/cuda-12.1/lib64
sudo rm -f libcudnn*
cd /usr/local/cuda-12.1/include
sudo rm -f cudnn*
参考文档:
https://discuss.pytorch.org/t/could-not-load-library-libcudnn-cnn-train-so-8-but-im-sure-that-i-have-set-the-right-ld-library-path/190277/2