今天早上搬砖的时候发现在自己的工作站上安装的 Windows 10 64 bit 开机以后只能识别 96 GB 内存,但是机器上面装了 128 GB (16 GB x8) 内存
排查过程:
内存不能识别问题可能有以下几个原因
连接内存控制器的CPU 针脚和主板 CPU 插槽接触不良,这样会导致无法开机,如果把针脚对应的主板插槽上的内存拔掉就可以开机。
主板 BIOS 问题。可以通过升级 BIOS 或者用编程器把其他版本的 BIOS 写入 BIOS 芯片解决。
内存“坏了”:可能是金手指氧化或者内存芯片损坏, 此时一般可以正常开机,需要进一步排查。如果主板开启多通道内存支持,只要该通道有一条内存出现问题,所有属于该通道的内存都不能正常工作。
电脑可以正常开机, 主板的 BIOS 上个月刚更新过,所以原因 1 和 2 排除,现在检查原因 3
使用 CPU-Z 读取内存信息, 提示内存容量是 112 GB (16 GB x7),查看 SPD 信息,发现插槽 8 无信息。翻看 Gigabyte X99 SLI 的主板手册,找到插槽 8 对应的位置,把内存拔下来用橡皮擦 擦拭金手指再装上。 系统仍然只能识别 96 GB 内存,但是 CPU-Z 已经可以读取插槽 8 的 SPD 信息
接下来重启电脑,进入 BIOS 设置,查看内存时序信息。 这块主板有四个内存通道 (Channel A,B,C,D) 查看并比较每个通道的时序信息,发现 Channel A 相比其他通道缺少了一些时序信息,于是判断 Channel A 的内存可能有问题
通过主板手册找到 Channel A 对应插槽,拔下两条内存,用橡皮擦 擦拭金手指,并且交换插槽位置重新安装内存。 开机后所有内存都可以被正常识别。
经验: 工作站和服务器长期处于开机状态,因此电子元件上的金属接触面容易氧化,需要定期清理。