Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Data Domain: Proceso de FS PANIC en la caché de inodo cuando se queda sin memoria en el pool de elementos de caché

Summary: Se ha encontrado un defecto en algunas versiones recientes de DDOS (confirmadas en 7.7.4, 7.9.0.10 y 7.10.0, lo cual es falso si también afecta a DDOS 7.7.3) mediante el cual se puede producir un estado PANIC de proceso de FS en el código de caché de inodo cuando, según la carga de trabajo, un pool de elementos de caché se queda sin memoria para asignaciones adicionales. ...

This article applies to   This article does not apply to 

Symptoms

No hay ninguna degradación o advertencia avanzada para este problema, que se manifestará en forma de falla del proceso de FS (PANIC), después de lo cual, el proceso se reiniciará y volverá a aparecer automáticamente.
Debido a la ruta de código que se está realizando, el proceso de FS puede entrar en estado de ALARMA de varias maneras diferentes, incluidas las siguientes:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE))
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
En los archivos de registro del proceso de FS (ddfs.info) se encontrarán los siguientes mensajes antes de cada bloqueo del proceso:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True
01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001

Los mensajes que indican que el proceso interno se completó en un 99 % y, a continuación, no se pudieron asignar más elementos, lo que produjo un bloqueo del proceso. 

NOTA: Se sabe que este problema solo afecta a las siguientes versiones:
  • DDOS 7.7.3.x: No completamente confirmado
  • DDOS 7.7.4.x
  • DDOS 7.9.0.10
  • DDOS 7.10.0.x

Cause

Para cualquier operación de archivo, como lectura/escritura, se asigna una estructura de inodo desde el pool de elementos dd_cache.
Si esta caché está llena y entra una nueva solicitud, se expulsa un elemento de esta caché y se completa la nueva solicitud.
Esta expulsión se basa en una política de tiempo (se expulsa un elemento si no se ha accedido en los últimos "x" segundos).
En caso de que esta caché se caliente demasiado (se ha accedido a todos los elementos en los últimos "x" segundos) y no se puede expulsar ningún elemento incluso después de varios reintentos, fm_iget devuelve DD_ERR_NOMEM.
Algunos llamadores de esta asignación de pool de elementos no podrán manejar el error correctamente y, por lo tanto, el proceso de FS entre en ESTADO DE ALARMA y el núcleo de volcado deben funcionar "fm_iget" arroja cualquier error. Es por eso que hay algunas firmas PANIC diferentes correspondientes al defecto de código subyacente.

Resolution

El problema de código fundamental que da como resultado estos bloqueos del proceso de FS se corrige mediante DDOS-168410 en las siguientes versiones (y todas las posteriores en las mismas ramas de código):
  • DDOS 7.7.5.1
  • DDOS 7.10.1.0
  • DDOS 7.11.0
Los clientes afectados por este problema que no pueden actualizar inmediatamente a ninguna de las versiones anteriores pueden intentar una solución alternativa para la cual deben ponerse en contacto con el soporte de Dell.
Si ejecuta una versión con el problema (las mencionadas anteriormente), pero no experimentó un bloqueo inesperado del proceso de FS, pero aún coincide con los síntomas de este artículo de la base de conocimientos, recomendamos no aplicar proactivamente la solución alternativa y, en su lugar, actualizar a cualquiera de las versiones corregidas anteriores (o a cualquiera de sus sucesores) para aprovechar las últimas actualizaciones y correcciones de código.

Affected Products

Data Domain