最近一次使用服务器运行caffe-ssd的代码,无法将训练日志进行保存,以为是三两天没有关机,导致的结果,于是便想重启一下,选择了关机。谁知道关机后再开机,屏幕没有显示了。
1)
一开始以为是GPU的问题,切换了两个GPU,两个卡槽,不同PCIE卡槽插一个,4次,加一次两个GPU都插上,没有用。
2)
微信上咨询戴尔客服,让看下开机电源键,发现是闪烁2下黄,停顿一下,再闪烁7下,再停顿,如此反复。还让看下键盘上的大小写能否切换,发现usb借口都没有电,键盘上的灯不亮,鼠标也不亮。客服判断是内存问题,让把两个内存拔下来用橡皮擦一擦后再装上去,但是照做了(拆内存条的罩子时还需要把两侧两个蓝色的卡扣地方按进去)还是没有,倒是电源键不再闪黄灯,变成了白灯一直亮了。
3)
到了五点,戴尔微信客服下班了,下班前提供了24小时电话服务联系方式,便电话咨询了,接线的技术人员在听了我之前的问题后,让我把两个内存都拔了开机试试,发现电源键闪烁三下黄灯,停顿后再亮三下黄灯,再停顿,如此反复,他便判断是内存的问题,让插一个内存开机,如果不行,再换一个。还说电源键白色常亮表示开机正常,屏幕没有显示,是因为这款服务器开机比较慢,慢的一个小时都有-_-||。于是我插了一个16G的内存,开机,电源键白色,但是等了半个小时屏幕还是没有反应,便将这个内存条拔了,换了另外一个,开机一会儿屏幕就有显示了,提示内存有变化,选择retry reboot之后就能进系统了。
然后进系统运行了一段时间程序后,关机把另外一根内存条也插上,开机也正常了。
这次出现的问题有些无语,花费了一天时间解决,但总归是解决了,谨记之。