Symptômes
Los ingenieros de Dell han observado un problema poco frecuente durante las operaciones del sistema, al utilizar la SSD PCIe NVMe Express Flash Dell PM1725a, en el cual el dispositivo puede quedar offline y permanecer inaccesible. Es posible volver a acceder a la unidad después de un reinicio.
Errores como "nvme_remove_namespaces", "nvme0n1: detected capacity change from xxxxxxxxx to 0" y diversos errores del sistema de archivos se pueden ver en /var, /log, /messages u otros registros de eventos del sistema. Además, el uso continuado de la SSD requeriría volver a crear el sistema de archivos. Este problema se resolvió con una corrección de firmware.
Cause
El problema se debe a una falla en la administración de la caché. Cuando el búfer de la caché de escritura está lleno, la controladora descarta erróneamente una operación de ESCRITURA entrante desde el host. Esto se resuelve gestionando las operaciones de ESCRITURA entrantes desde el host después de que se haya vaciado el contenido de la caché.
Résolution
En abril de 2019, se resolvió el problema mediante la versión de firmware 1.1.2, A03, de la SSD PCIe NVMe Express Flash Dell PM1725a.
NOTA: Dado que todas las versiones de firmware de PM1725a anteriores a 1.1.2 son susceptibles a este problema, el firmware que no sea 1.1.2 se eliminó del sitio web de soporte de Dell y ya no está disponible para su descarga.
Produits concernés
Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, PowerEdge R640, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R830, PowerEdge R840