Questo articolo fornisce le operazioni di risoluzione dei problemi per il puncturing dei blocchi danneggiati sui dischi rigidi nei server PowerEdge con controller PERC. Specialmente quando non è possibile eseguire il backup, le seguenti informazioni possono contribuire a ripristinare allo stato ottimale un'unità virtuale danneggiata.
OpenManage Server Administrator (OMSA) mostra una croce rossa vicino a un disco virtuale (Figura 1).
Figura 1. Disco virtuale con croce rossa in stato (ad esempio H800)
Il Registro di sistema di Windows Mostra errori di blocco danneggiato (Figura 2).
Figura 2. Errore di blocco danneggiato nel registro di sistema di Windows visualizzato
Il registro del controller RAID (TTYLOG) mostra errori come:
02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f
Per ulteriori informazioni sulla ricezione di questi registri specifici, consultare il nostro articolo sulla raccolta dei registri.
Gli array RAID non sono immuni da errori dei dati. Il firmware del controller RAID e dei dischi rigidi contiene funzionalità volte a rilevare e correggere molti tipi di errori dei dati prima che vengano scritti su un array o su un'unità. L'utilizzo di un firmware obsoleto può comportare la scrittura di dati errati su un array/unità perché mancano le funzioni di gestione/correzione degli errori disponibili nelle versioni più recenti del firmware.
Gli errori dei dati possono anche essere causati da blocchi fisici danneggiati. Questa situazione può verificarsi, ad esempio, quando la testina di lettura/scrittura tocca il piatto rotante (condizione nota come "head crash"). I blocchi possono anche danneggiarsi nel tempo a causa della riduzione della capacità del piatto di memorizzare magneticamente i bit in una posizione specifica. Spesso, i blocchi danneggiati a seguito del deterioramento di un piatto possono comunque essere letti correttamente. Un blocco danneggiato del genere potrebbe essere rilevato solo in modo intermittente o con un'estesa diagnostica eseguita sulle unità.
Un blocco danneggiato, detto anche indirizzo LBA (Logical Block Address, indirizzo di blocco logico) danneggiato, può essere causato anche da errori logici dei dati. Questa condizione si verifica quando i dati vengono scritti in modo non corretto su un'unità anche se la scrittura viene registrata come riuscita correttamente. È inoltre possibile che dei dati corretti memorizzati su un'unità vengano modificati inavvertitamente. Un esempio è rappresentato da un "bit flip", o inversione di bit, che può verificarsi quando la testina di lettura/scrittura supera una posizione o esegue la scrittura su una posizione vicina e fa sì che i dati, sotto forma di zeri e uno, cambino assumendo un valore diverso. Tale condizione genera un danneggiamento della "coerenza" dei dati. Il valore dei dati su un blocco specifico è diverso rispetto ai dati originali e potrebbe non corrispondere più al checksum dei dati. L'LBA fisico è valido e può essere scritto correttamente, ma contiene attualmente dati errati e può essere interpretato come un blocco danneggiato.
Per ulteriori informazioni, leggere il nostro articolo Su doppi errori e lacune negli array RAID.
Creare un backup dei dati convalidato a livello di file
Assicurarsi di sostituire tutte le unità guaste che mostrano errori predittivi
Eliminare e ricreare il disco virtuale
Eseguire un'inizializzazione completa del disco virtuale
Eseguire la verifica della coerenza del nuovo disco virtuale creato
I dati possono quindi essere ripristinati sul disco virtuale integro
Consiglio: Aggiornare il firmware di tutti i dischi rigidi alla versione più recente
OMSA offre la possibilità di eliminare gli avvisi di blocco danneggiato. Per eliminare i blocchi danneggiati, si consiglia la seguente procedura:
Quando si esegue una copia di backup del disco virtuale con l'opzione Verify selezionata, è possibile che si verifichino due scenari:
Eseguire Patrol Read (in Virtual Disk Tasks di OMSA) e controllare il registro eventi di sistema per verificare che non vengano trovati nuovi blocchi danneggiati. Se sono ancora presenti blocchi danneggiati, procedere alla fase successiva. In caso contrario, il problema è stato risolto.
Per eliminare questi blocchi danneggiati, eseguire l'attività Clear Virtual Disk Bad Blocks. Questa operazione può essere eseguita nell'interfaccia utente grafica di OMSA o utilizzando il comando da interfaccia a riga di comando:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id
omreport storage controller
per visualizzare gli ID del controller, quindi digitare per visualizzare gli ID dei dischi omreport storage vdisk controller=ID
virtuali