Nvidia H20 显卡在执行bf16,f16推理时程序异常中断 时间是 2025年3月4日 课题组新到的8卡H20服务器在使用过程中,torch加载模型进行bf16的推理时,出现Floating point exception (core dumped)错误 当时一头雾水,后来苦苦寻找,找到git上的一个解决方案。 pip install nvidia-cublas-cu12==12.4.5.8 遂解决。有用记得点个赞,看看有多少人被这个问题困惑