Symptoms
W przypadku tego problemu nie występuje degradacja ani ostrzeżenie z wyprzedzeniem, które objawia się niepowodzeniem procesu FS (PANIC), po czym proces zostanie uruchomiony ponownie i automatycznie pojawi się prawidłowo.
Ze względu na wykonywaną ścieżkę kodu proces FS może ulec panice na kilka różnych sposobów, w tym:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE))
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
W plikach dziennika procesu FS (ddfs.info) przed każdą awarią procesu zostaną znalezione następujące komunikaty:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True
01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
Komunikaty wskazujące, że wewnętrzny proces zapełnił się w 99%, a następnie nie można przydzielić dalszych elementów, co prowadzi do awarii procesu.
UWAGA: Ten problem dotyczy tylko następujących wersji:
- DDOS 7.7.3.x: Nie zostało to w pełni potwierdzone
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
Cause
W przypadku każdej operacji pliku, takiej jak odczyt/zapis, struktura węzłów jest przydzielana z puli elementów dd_cache.
Jeśli pamięć podręczna jest pełna i pojawi się nowe żądanie, element zostanie wykluczony z tej pamięci podręcznej i nowe żądanie zostanie spełnione.
Wykluczenie jest oparte na zasadach czasu (element jest wykluczany, jeśli nie był dostępny w ostatnich sekundach "x").
W przypadku, gdy pamięć podręczna stanie się zbyt gorąca (wszystkie elementy były dostępne w ciągu ostatnich sekund "x"), a żadne elementy nie mogą być wykluczane nawet po wielu ponownych próbach, fm_iget zwraca DD_ERR_NOMEM.
Niektórzy dzwoniący alokacji puli elementów nie będą w stanie prawidłowo obsłużyć błędu, dlatego proces FS do PANIC i rdzenia zrzutu powinny działać "fm_iget" zwraca wszelkie błędy. Dlatego istnieje kilka różnych sygnatur PANIC odpowiadających defektowi kodu źródłowego.
Resolution
Podstawowy problem z kodem powodującym awarię procesu FS zostaje rozwiązany przy użyciu
DDOS-168410 w następujących wersjach (i wszystkie późniejsze w tych samych gałęziach kodu):
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
Klienci, których dotyczy ten problem, którzy nie mogą natychmiast zaktualizować do żadnej z powyższych wersji, mogą spróbować obejść problem, z którego muszą skontaktować się z działem pomocy technicznej firmy Dell.
W przypadku uruchomienia wersji z problemem (wymienionych powyżej), ale nie wystąpiła nieoczekiwana awaria procesu FS, ale pasująca do symptomów w tej wiedzy, zalecamy, aby nie proaktywnie zastosować obejścia, a zamiast tego uaktualnić do żadnej ze stałych wersji powyżej (lub ich następców) w celu skorzystania z najnowszych aktualizacji i poprawek kodu.
Affected Products
Data Domain