Sommario
- Descrizione
- Identificazione di un errore interno della CPU nel registro eventi del sistema
- Risoluzione di un errore interno della CPU
- Problemi del sistema operativo
Descrizione
L'errore interno della CPU (CPU IERR) o l'errore di controllo computer della CPU in genere non è
un errore della CPU stessa. ma indica che la CPU ha rilevato un errore di sistema o ha ricevuto un'istruzione errata da un componente del sistema. È dovuto a un evento non della CPU, come la mancata corrispondenza del firmware, un'interruzione del BUS di sistema o un'interruzione della lettura/scrittura della memoria. L'errore può essere causato teoricamente da QUALSIASI componente di sistema, software o hardware.
Questo articolo contiene le best practice per la gestione di questi errori ed è valido per tutti i server PowerEdge.
Avvertenza: Non rimuovere la CPU. Gli errori interni della CPU sono raramente causati da un malfunzionamento della CPU e il riferimento alla CPU si basa esclusivamente sul modulo che ha segnalato l'errore. Nonostante ciò che si legge su alcuni siti Web o nei forum, è essenziale non rimuovere la CPU a meno che non si disponga delle competenze e i mezzi necessari per farlo.
Identificazione di un errore interno della CPU nel registro
eventi di sistema Un errore interno della CPU viene visualizzato nel registro eventi di sistema come "CPU 1 has an internal error (IERR)" o "CPU 2 has an internal error (IERR)."
Figura 1: DSET che mostra CPU IERR
Risoluzione di un errore interno
della CPU Per risolvere questo errore, seguire un piano strutturato di risoluzione dei problemi per determinare quale componente ha causato l'errore e come risolverlo.
1.
Controllare i registri degli eventi di sistema per tutti gli altri errori che si verificano più o meno nello stesso momento dell'errore interno della CPU.
2. Se si individuano altri errori, risolverli. Come risolvere gli errori dipende dall'errore individuato.
3. Aggiornare il BIOS e il firmware iDRAC alla versione più recente.
- Aggiornare il BIOS o iDRAC utilizzando l'interfaccia iDRAC è spiegato in questo articolo.
- Se iDRAC non è disponibile, altri metodi di aggiornamento sono elencati nel seguente articolotutorial.
4. Cancellare il registro eventi del sistema. In Open Manage Server Administrator o iDRAC (per entrambi, aprire il registro eventi, scorrere verso il basso e premere Clear log), i vecchi errori interni della CPU genereranno un avviso dopo la risoluzione dell'errore, a meno che non vengano cancellati dal registro eventi del sistema.
5. Se non vengono rilevati errori o l'errore interno della CPU rimane, arrestare il sistema, rimuovere il cavo di alimentazione e tenere premuto il pulsante di alimentazione del server per 20 secondi prima di ricollegare il cavo di alimentazione e accendere il sistema. Questo processo è noto come scaricamento dell'energia residua.
6. Se l'errore persiste, contattare il supporto tecnico per ulteriore assistenza. Le opzioni di contatto sono riportate di seguito.
Problemi del sistema operativo
Alcuni eventi del sistema operativo possono causare la registrazione di un errore interno della CPU all'interno del registro eventi di sistema. Gli errori registrati includono:
- Errori irreversibili del kernel,
- Interazioni di programmi di terze parti,
- Interruzioni critiche del runtime o
- Overcommitment delle risorse.
Ciò è dovuto alla CPU che identifica il processo come non riconosciuto e che afferma l'errore interno della CPU in risposta.
Se l'errore interno della CPU è stato causato da un evento del sistema operativo, è necessario controllare il registro eventi del sistema operativo e fare riferimento incrociato con il registro eventi del sistema server per identificare l'evento del sistema operativo che ha causato l'errore interno della CPU. Una volta identificato l'evento del sistema operativo, è consigliabile contattare il fornitore del sistema operativo per assitenza nella risoluzione.