Centos 服务器系统内存故障排查

2022-06-12 20:21:09 【大中小】

因为 68 – 71 软SBC服务器都是 7系统，所以我们可以通过以下来排查内存是否出现损坏。

grep "[0-9]" /sys/devices/system/edac/mc/mc/csrow/ch*_ce_count

Centos 服务器系统内存故障排查Centos 服务器系统内存故障排查

1> count不为0表示有错误

2> mc代表第几个cpu，

3> csrow内存通道，

4> ch第几个内存

EDAC即error detection and correction（错误检测与纠正），是内部的机制。在上面的日志中，可以清楚地看出是内存读错误。MC即memory controller（内存控制器）。CE则代表correctable error，是ECC内存中可以纠正的错误，相对地还有UE（uncorrectable error）。为了摸清是哪些内存出了问题，找出所有内存的CE计数,由上图可知，第四块内存出现了故障。

通过 dmidecode -t memory ，可以查看每个DIMM
Centos 服务器系统内存故障排查Centos 服务器系统内存故障排查

2.CPU排查 cat /sys/devices/system/cpu/cpu*/online



【大中小】【打印】【关闭】【返回顶部】
分享到:
上一篇：Linux文件传输常用的三大命令！	下一篇：Owl Labs Meeting Owl Pro信息泄..

行业动态

联系我们