Symptoms
Pro tento problém neexistuje žádné upozornění na snížení kvality ani předběžné varování, které se projeví ve formě selhání procesu FS (PANIC), a poté se proces automaticky restartuje a znovu se zobrazí v pořádku.
Kvůli využití cesty kódu může proces FS dojít k panice několika různými způsoby, včetně následujících:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE))
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
V souborech protokolu procesu FS (ddfs.info) budou před každým selháním procesu nalezeny následující zprávy:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True
01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
Zprávy oznamující, že interní proces byl plný z 99 %, poté nebyl schopen přidělit žádné další prvky, což vedlo k selhání procesu.
POZNÁMKA: Tento problém se týká pouze následujících verzí:
- DDOS 7.7.3.x: Zcela nepotvrzeno
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
Cause
Pro všechny operace souborů, jako je čtení/zápis, je struktura inode alokována z fondu prvků dd_cache.
Pokud je tato mezipaměť plná a přijde nový požadavek, je z této mezipaměti odebrán prvek a je splněn nový požadavek.
Toto vyloučení je založeno na zásadě času (prvek je vyřazen, pokud k němu nebyl během posledních "x" sekund přistupován).
V případě, že se tato mezipaměť příliš zahřeje (přístup ke všem prvkům proběhl během posledních "x" sekund) a nelze vysunul žádné prvky ani po několika opakováních, fm_iget se vrátí DD_ERR_NOMEM.
Někteří volající tohoto fondu prvku nebudou moci chybu řádně zpracovat, a tak způsobí, že proces FS z paniky a jádra výpisu by mělo fungovat jako "fm_iget". Proto existuje několik různých podpisů paniky odpovídající základní závadě kódu.
Resolution
Základní problém s kódem, který vede k těmto pádům procesu FS, je vyřešen pomocí systému
DDOS-168410 v následujících verzích (a všech novějších ve stejných větvích kódu):
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
Zákazníci, kterých se tento problém týká, kteří nemohou okamžitě upgradovat na žádnou z výše uvedených verzí, mohou zkusit náhradní řešení, pro které musí kontaktovat podporu společnosti Dell.
Pokud používáte verzi s problémem (uvedenou výše), ale nedošlo k neočekávanému selhání procesu FS, který ještě neodpovídá příznakům v tomto článku znalostí, doporučujeme toto zástupné řešení neprovážit a namísto toho provést upgrade na jakoukoli z výše uvedených opravených verzí (nebo jejich nástupce), abyste mohli využít nejnovější aktualizace a opravy kódu.
Affected Products
Data Domain