Linux服务器EDAC CE memory read error
2020-11-23    241    0    0
senier

查看dmesg命令的设备信息时,发现大量如下的日志:

EDAC即error detection and correction(错误检测与纠正),是Linux系统内部的机制。在上面的日志中,可以清楚地看出是内存读错误。MC即memory controller(内存控制器)。CE则代表correctable error,是ECC内存中可以纠正的错误,相对地还有UE(uncorrectable error)。
为了摸清是哪些内存出了问题,找出所有内存的CE计数:


grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count​


通过dmidecode -t memory命令,可以查看每个DIMM(也就是常说的内存条)对应的位置。然后根据映射关系,去服务器上将出现问题的两根内存条更换,问题就解决了。

Pre: CentOS6/7 -- 启动服务及日志查看

Next: 如何在SHH里通过代码修复宝塔

241
Table of content