Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Data Domain:キャッシュ エレメント プールのメモリー不足時にinodeキャッシュでFSプロセス パニックが発生する

Summary: ワークロードに応じてキャッシュ要素プールがメモリー不足になり、ワークロードに応じてinodeキャッシュ コードでFSプロセス パニックが発生する可能性がある最近のDDOSバージョン(7.7.4、7.9.0.10、7.10.0でも、DDOS 7.7.3に影響を与える場合は疑わしい)で欠陥が見つかりました。

This article applies to   This article does not apply to 

Symptoms

この問題に対する劣化や事前警告はありません。この警告は、FSプロセス障害(PANIC)の形で現れます。その後、プロセスが再起動し、自動的に正常に再び起動します。
コード パスが実行されているため、次のようないくつかの方法でFSプロセスがパニック状態になる場合があります。
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE))
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
FSプロセス ログ ファイル(ddfsinfo)各プロセスがクラッシュする前に、次のメッセージが表示されます。
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True
01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001

内部プロセスがいっぱいであることを示すメッセージが99%フルで、それ以上の要素を割り当てることができないため、プロセスクラッシュが発生しました。 

メモ: この問題は、次のバージョンにのみ影響することが知られています。
  • DDOS 7.7.3.x: 完全には確認されていません
  • DDOS 7.7.4.x
  • DDOS 7.9.0.10
  • DDOS 7.10.0.x

Cause

読み取り/書き込みなどのファイル操作では、inode構造がdd_cacheエレメント プールから割り当てられます。
このキャッシュがいっぱいになり、新しいリクエストが入ってきた場合は、このキャッシュから要素がエビクトされ、新しいリクエストが処理されます。
このエビクションは、時間ポリシーに基づいています(最後の「x」秒でアクセスされていない場合、要素はエビクションされます)。
このキャッシュがホットになりすぎて(すべての要素が最後の「x」秒以内にアクセスされた)、複数回の再試行後でも要素をエビクトできない場合、fm_igetはDD_ERR_NOMEMを返します。
このエレメント プール割り当ての一部の呼び出し元はエラーを正常に処理できないため、FSプロセスがパニックになり、ダンプ コアが「fm_iget」機能すると、エラーが返されます。そのため、基盤となるコードの欠陥に対応するいくつかの異なるパニック シグネチャがあります。

Resolution

これらのFSプロセスのクラッシュの原因となる基本的なコードの問題は、次のバージョン(および同じコード ブランチ内の以降のすべてのバージョン)でDDOS-168410 を使用して修正されています。
  • DDOS 7.7.5.1
  • DDOS 7.10.1.0
  • DDOS 7.11.0
この問題の影響を受けたお客様が、上記のどのリリースにもすぐにアップグレードできない場合は、Dellサポートに連絡する必要がある回避策を試すことができます。
問題のあるバージョン(上記のリスト)を実行しているが、このKBの現象と一致する予期しないFSプロセスクラッシュが発生していない場合は、回避策をプロアクティブに適用しないことをお勧めします。代わりに、上記の修正済みリリース(またはその後継)のいずれかにアップグレードして、最新のアップデートとコード修正を利用してください。

Affected Products

Data Domain