这个情况比较少见,被我碰上了。表现为,按网上教程安装显卡驱动,无论是run文件还是在线安装,还是图形界面安装,驱动可以安装成功,查看驱动信息也可以看到nouveau驱动已经变为nvidia驱动,但只要输入nvidia-smi,或重启电脑,马上就黑屏然后显卡风扇狂转,死机,卸载nvidia驱动恢复nouveau后系统显示又恢复正常
一度以为是显卡型号和nvidia驱动版本、系统版本不匹配造成的,结果试了无数组合都一样,最接近的一次是都安装成功了,环境也配置了,结果一跑训练又崩了,一切又回到了解放前,并且再也没成功过。
搞得我一直怀疑ubuntu系统是不是无法安装nvidia驱动,后来有机会找了另一块nvidia显卡,替换试了一下,结果一切正常!原来是我这块显卡出问题了,具体什么问题不明,但只要是我这块显卡系统就黑屏,别的显卡正常!
总结教训就是,不要被nouveau下的显示状态蒙蔽,分辨率可调就以为显卡没问题,如果安装nvidia驱动多次后仍不成功,不妨试试更换一下显卡,排查一下是否是显卡故障。