PowerStore:ノードがLinuxドライバーのメモリー リークにより予期せず再起動することがある
概要: SCSIターゲット(SCST)の「Report LUNs」の応答によるカーネル領域内のメモリー リークが原因で、ノードが予期せずリセットされることがあります。
この記事は次に適用されます:
この記事は次には適用されません:
この記事は、特定の製品に関連付けられていません。
すべての製品パージョンがこの記事に記載されているわけではありません。
現象
システムでは、次のような過剰なメッセージが報告されます。
これらのメッセージの数を確認するには、次のようなコマンドを使用します。
ログには、次のようにスターベーションの兆候が現れることがあります。
ダンプ ファイルは通常、このイベントに対して作成されますが、根本的な原因の分析(RCA)には必要ありません。svc_dc list_dumpsを確認してください。
| svc_journalctl | grep "REPORT LUNS" Apr x 01:00:31 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:31 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:33 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:34 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:34 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' |
これらのメッセージの数を確認するには、次のようなコマンドを使用します。
| svc_journalctl --since="today" | grep -c "REPORT LUNS" 44835 |
ログには、次のようにスターベーションの兆候が現れることがあります。
| svc_journalctl--since="today" | grep -i starved Apr x 01:47:58.501672 xxxx-A xtremapp[22524]: Apr x 01:47:58.500331 M [log_id:22772][3840(3891 nb_truck_0_sym 0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 550906 us (the threshold is 500000) #STARV Apr x 03:14:00.770872 xxxx-A xtremapp[22524]: Apr x 03:14:00.745703 M [log_id:22772][3840(3891 nb_truck_0_sym 0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 518854 us (the threshold is 500000) #STARV Apr x 04:35:39.509945 xxxx-A xtremapp[22524]: Apr x 04:35:39.507440 M [log_id:22772][3840(3891 nb_truck_0_sym 0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 523371 us (the threshold is 500000) #STARV |
ダンプ ファイルは通常、このイベントに対して作成されますが、根本的な原因の分析(RCA)には必要ありません。svc_dc list_dumpsを確認してください。
原因
この問題は、ESXiからの過剰な「Report LUNs」コマンドによる、SCSTのカーネル領域内のメモリー リークが原因で発生します。これにより、ノードのリセットをトリガーするノード間のキープアライブ通信に遅延が発生する場合があります。
解決方法
この問題は、PowerStoreOS 1.0.4.0.5.006(V1 SP4.1)で解決されています。
この修正については、リリース ノートのMDT-261192:「A node may reboot unexpectedly, due to a Linux driver memory leak」に記載されています。
この修正については、リリース ノートのMDT-261192:「A node may reboot unexpectedly, due to a Linux driver memory leak」に記載されています。
対象製品
PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000T製品
PowerStore 9000X文書のプロパティ
文書番号: 000185532
文書の種類: Solution
最終更新: 04 11月 2021
バージョン: 5
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。