メモ: この記事は、Xeonスケーラブル プロセッサーを搭載した新しいシステムには適用されません。新しいシステムの場合は、この記事「インテルXeonスケーラブル プロセッサー搭載Dell PowerEdgeサーバーでのDDR4自己修復とは」を確認してください。
スワップ テストによるPowerEdgeシステムのメモリー エラーのトラブルシューティング
1つまたは複数のメモリーDIMMの位置でシングルビット エラー(SBE)および/またはマルチビット エラー(MBE)が報告された場合、原因がDIMM自体にあるとは限らないため、障害がどこにあるかを正確に判断するには、いくつかの簡単なトラブルシューティングを実行する必要があります。R715のiDRACインターフェイスに表示されるメモリー エラーの例については、 図1 を参照してください。
図1: iDRAC 6ログに表示されるメモリー エラー (英語のみ)
メモリーの問題を切り分けるということは、メモリーDIMMを異なるメモリー ソケット、チャネル、バンク、コントローラーにスワップすることを意味します。障害を絞り込むためにDIMMを交換する方法はいくつかあります。障害が発生したDIMMまたはソケットを特定するには、これらの方法を複数使用する必要がある場合があります。以下に、これらのメソッドの表現を示します。分かりやすく説明するために、障害が発生したDIMMはA1、または画像の青でマークされたセットのいずれかであると仮定します。
障害が発生したDIMMまたはDIMMを識別するには、DIMMを個別にではなく、グループ(チャネルまたはバンク別)でスワップする方法が最適です。
故障したDIMMまたは複数のDIMMを含むDIMMのグループを特定したら、単一のDIMMの移動を使用して、障害が発生したDIMMを識別できます。
DIMM A1(青でマーク)とDIMM A9(赤でマーク)をスワップして、このDIMMを別のメモリー チャネルおよびバンクで試します
図2:DIMM A1とDIMM A9のスワップ
DIMM A1(青でマーク)をDIMM B1(赤でマーク)とスワップすると、DIMMはまったく異なるメモリー コントローラー(CPU)に配置されます。
図3: DIMM A1とDIMM B1のスワップ
DIMMのバンク全体(A1、A2、A3:青でマーク)を別のバンク(B1、B2、B3:赤でマーク)とスワップすると、新しいメモリー コントローラーで、新しいバンクのDIMMのバンク全体がテストされます。
図4: DIMM A1、A2、A3とDIMM B1、B2、B3のスワップ
DIMMのチャネル全体(A1、A4、A7:青でマーク)を別のチャネル(B1、B2、B3:赤でマーク)とスワップして、新しいチャネルと新しいメモリー コントローラーでDIMMのチャネル全体をテストします。
図5: DIMM A1、A4、A7とDIMM B1、B4、B7のスワップ
一般的に、DIMMエラーはエラーで識別されたDIMMに追従する傾向があります。たとえば、DIMM A1に関するSBEレポートでは、このDIMMを別のDIMMとスワップすると、次のいずれかになります。
-
-