Symptômes
Gli ingegneri Dell hanno riscontrato un raro problema durante le attività del sistema quando si utilizza l'unità SSD Express Flash NVMe PCIe Dell PM1725a, per cui il dispositivo può diventare offline e rimanere inaccessibile. L'unità potrebbe essere nuovamente accessibile dopo un riavvio.
Errori come "nvme_remove_namespaces", "nvme0n1: detected capacity change from xxxxxxxxx to 0" e vari errori del file system possono essere visualizzati in /var, /log, /messages o in altri registri eventi di sistema. Inoltre, l'utilizzo continuato dell'unità SSD richiederebbe la ricreazione del file system. Questo problema è stato risolto con una correzione del firmware.
Cause
Il problema è causato da un errore nella gestione della memoria cache. Quando il buffer della cache in scrittura è pieno, il controller elimina erroneamente un'operazione di SCRITTURA in ingresso dall host. Il problema si risolve agendo sulle operazioni WRITE in ingresso dall'host dopo aver scaricato tutto il contenuto della memoria cache.
Résolution
Il problema è stato risolto nell'aprile 2019 aprile con il rilascio del firmware dell'unità SSD Express Flash NVMe PCIe Dell PM1725a versione 1.1.2, A03.
NOTA: Poiché tutte le versioni del firmware dell'unità PM1725a antecedenti alla 1.1.2 possono essere soggette a questo problema, ogni versione del firmware diversa da 1.1.2 è stata rimossa dal sito web di supporto Dell e non è più disponibile per il download.
Produits concernés
Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, PowerEdge R640, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R830, PowerEdge R840