Symptômes
Les ingénieurs Dell ont constaté un problème peu fréquent lors des opérations système effectuées avec le disque SSD Express Flash NVMe PCIe Dell PM1725a, qui entraîne la mise hors ligne du disque qui reste alors inaccessible. Le lecteur peut être à nouveau accessible après un redémarrage.
Des erreurs telles que « nvme_remove_namespaces », « nvme0n1 : detected capacity change from xxxxxxxxx » et diverses erreurs de système de fichiers peuvent s’afficher dans /var, /log, /messages ou d’autres journaux d’événements système. En outre, la poursuite de l’utilisation du disque SSD nécessiterait la recréation du système de fichiers. Ce problème a été corrigé avec un correctif du firmware.
Cause
Le problème est dû à une défaillance de la gestion du cache. Lorsque la mémoire tampon du cache d’écriture est pleine, le contrôleur abandonne par erreur une opération d’écriture entrante de l’hôte. Ce problème est résolu via la maintenance des opérations d’ÉCRITURE entrantes à partir de l’hôte une fois que le contenu du cache a été vidé.
Résolution
Le problème a été résolu à partir d’avril 2019 avec le firmware Dell Express Flash NVMe PCIe SSD PM1725a, version 1.1.2, A03.
Remarque : Étant donné que toutes les versions du firmware PM1725a antérieures à la version 1.1.2 sont sujettes à ce problème, les firmwares autres que la version 1.1.2 ont été retirés du site Web de support Dell et ne sont plus disponibles au téléchargement.
Produits concernés
Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, PowerEdge R640, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R830, PowerEdge R840