Come gestire il puncturing (blocchi danneggiati) su dischi virtuali per i server PowerEdge

Summary: procedura di risoluzione dei problemi per il puncturing dei blocchi danneggiati sui dischi rigidi nei server PowerEdge con controller PERC. Specialmente quando non è possibile eseguire il backup, le seguenti informazioni possono contribuire a ripristinare allo stato ottimale un'unità virtuale danneggiata. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Check out other resources

Symptoms

Cause

Resolution

Questo articolo fornisce le operazioni di risoluzione dei problemi per il puncturing dei blocchi danneggiati sui dischi rigidi nei server PowerEdge con controller PERC. Specialmente quando non è possibile eseguire il backup, le seguenti informazioni possono contribuire a ripristinare allo stato ottimale un'unità virtuale danneggiata.

1. Descrizioni degli errori

Errore n. 1:

OpenManage Server Administrator (OMSA) mostra una croce rossa vicino a un disco virtuale (Figura 1).

SLN111146_en_US__11343098652871.1
Figura 1. Disco virtuale con croce rossa in stato (ad esempio H800)

Nota: Dell OpenManage Server Administrator (OMSA) fornisce una soluzione di gestione dei sistemi completa, 1 a 1. OMSA può essere suddiviso in due applicazioni:
- Integrata - Interfaccia grafica utente (GUI) basata su web browser - Interfaccia a riga di
comando (CLI) - Tramite il sistema operativo

Errore n. 2:

Il Registro di sistema di Windows Mostra errori di blocco danneggiato (Figura 2).

SLN111146_en_US__31343098674763.2
Figura 2. Errore di blocco danneggiato nel registro di sistema di Windows visualizzato

Errore n. 3:

Il registro del controller RAID (TTYLOG) mostra errori come:

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Avvertenza: Il registro del controller (TTYLOG) potrebbe non mostrare errori.

Per ulteriori informazioni sulla ricezione di questi registri specifici, consultare il nostro articolo sulla raccolta dei registri.

2. Causa dell'errore:

Gli array RAID non sono immuni da errori dei dati. Il firmware del controller RAID e dei dischi rigidi contiene funzionalità volte a rilevare e correggere molti tipi di errori dei dati prima che vengano scritti su un array o su un'unità. L'utilizzo di un firmware obsoleto può comportare la scrittura di dati errati su un array/unità perché mancano le funzioni di gestione/correzione degli errori disponibili nelle versioni più recenti del firmware.
Gli errori dei dati possono anche essere causati da blocchi fisici danneggiati. Questa situazione può verificarsi, ad esempio, quando la testina di lettura/scrittura tocca il piatto rotante (condizione nota come "head crash"). I blocchi possono anche danneggiarsi nel tempo a causa della riduzione della capacità del piatto di memorizzare magneticamente i bit in una posizione specifica. Spesso, i blocchi danneggiati a seguito del deterioramento di un piatto possono comunque essere letti correttamente. Un blocco danneggiato del genere potrebbe essere rilevato solo in modo intermittente o con un'estesa diagnostica eseguita sulle unità.

Un blocco danneggiato, detto anche indirizzo LBA (Logical Block Address, indirizzo di blocco logico) danneggiato, può essere causato anche da errori logici dei dati. Questa condizione si verifica quando i dati vengono scritti in modo non corretto su un'unità anche se la scrittura viene registrata come riuscita correttamente. È inoltre possibile che dei dati corretti memorizzati su un'unità vengano modificati inavvertitamente. Un esempio è rappresentato da un "bit flip", o inversione di bit, che può verificarsi quando la testina di lettura/scrittura supera una posizione o esegue la scrittura su una posizione vicina e fa sì che i dati, sotto forma di zeri e uno, cambino assumendo un valore diverso. Tale condizione genera un danneggiamento della "coerenza" dei dati. Il valore dei dati su un blocco specifico è diverso rispetto ai dati originali e potrebbe non corrispondere più al checksum dei dati. L'LBA fisico è valido e può essere scritto correttamente, ma contiene attualmente dati errati e può essere interpretato come un blocco danneggiato.

Per ulteriori informazioni, leggere il nostro articolo Su doppi errori e lacune negli array RAID.

3. Procedura per risolvere il problema:

Nota: I dati correnti sul disco virtuale sono danneggiati e dovranno essere eliminati

Creare un backup dei dati convalidato a livello di file
- Un backup basato su blocchi trasferirebbe il problema
- Un backup a livello di file indica i file danneggiati (per questi file il backup non dovrebbe riuscire)
- Non c'è mai la garanzia del 100% che si riuscirà a conservare tutti i dati se già è presente il puncture stripe
Assicurarsi di sostituire tutte le unità guaste che mostrano errori predittivi
Eliminare e ricreare il disco virtuale
- Questo passaggio eliminerà tutti i dati dal disco virtuale
- Eliminare l'array
- Ricreare l'array come desiderato
Eseguire un'inizializzazione completa del disco virtuale
- Assicurarsi che non venga scelta l'inizializzazione rapida
- Solo l'inizializzazione completa (= lenta) risolve il problema
Eseguire la verifica della coerenza del nuovo disco virtuale creato
- Se la verifica della coerenza viene completata senza errori, l'array è ora integro e il puncturing è stato eliminato
I dati possono quindi essere ripristinati sul disco virtuale integro
Consiglio: Aggiornare il firmware di tutti i dischi rigidi alla versione più recente

4. Informazioni aggiuntive

OMSA offre la possibilità di eliminare gli avvisi di blocco danneggiato. Per eliminare i blocchi danneggiati, si consiglia la seguente procedura:

Quando si esegue una copia di backup del disco virtuale con l'opzione Verify selezionata, è possibile che si verifichino due scenari:
- L'operazione di backup ha esito negativo su uno o più file. In questo caso, ripristinare il file da un backup precedente. Dopo aver ripristinato il file, passare alla fase successiva.
- L'operazione di backup viene completata senza errori. Ciò indica che non sono presenti blocchi danneggiati sulla parte scritta del disco virtuale.
Nota: Se si ricevono ancora avvisi di blocchi danneggiati, i blocchi danneggiati si trovano in un'area non dati.
Eseguire Patrol Read (in Virtual Disk Tasks di OMSA) e controllare il registro eventi di sistema per verificare che non vengano trovati nuovi blocchi danneggiati. Se sono ancora presenti blocchi danneggiati, procedere alla fase successiva. In caso contrario, il problema è stato risolto.

Nota: La funzione patrol read automatizzata deve essere disattivata prima che l'opzione di esecuzione manuale di questa azione venga visualizzata in OMSA.
Per eliminare questi blocchi danneggiati, eseguire l'attività Clear Virtual Disk Bad Blocks. Questa operazione può essere eseguita nell'interfaccia utente grafica di OMSA o utilizzando il comando da interfaccia a riga di comando:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

Nota: Per ottenere i valori per l'ID del controller e l'ID del disco virtuale, digitare omreport storage controller per visualizzare gli ID del controller, quindi digitare per visualizzare gli ID dei dischi omreport storage vdisk controller=ID virtuali

Affected Products

Servers

Article Number: 000139277

Article Type: Solution

Last Modified: 01 Oct 2021

Version: 3

Check if your device is covered by Support Services.

Come gestire il puncturing (blocchi danneggiati) su dischi virtuali per i server PowerEdge

Symptoms

Cause

Resolution

Sommario:

1. Descrizioni degli errori

Errore n. 1:

Errore n. 2:

Errore n. 3:

2. Causa dell'errore:

3. Procedura per risolvere il problema:

4. Informazioni aggiuntive

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

Welcome

Welcome to Dell

Come gestire il puncturing (blocchi danneggiati) su dischi virtuali per i server PowerEdge

Detailed Article

Symptoms

Cause

Resolution

Affected Products

Symptoms

Cause

Resolution

Sommario:

1. Descrizioni degli errori

Errore n. 1:

Errore n. 2:

Errore n. 3:

2. Causa dell'errore:

3. Procedura per risolvere il problema:

4. Informazioni aggiuntive

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services