Sommaire
- Description
- Identification d’une CPU IERR dans le journal du système
- Résolution d’une CPU IERR
- Problèmes de système d’exploitation
Description
Une erreur interne de processeur (CPU IERR) ou de vérification du système du processeur n’est généralement
pas une erreur de processeur à proprement parler. mais un signe que le processeur a détecté une erreur dans le système ou qu’il a reçu une instruction erronée de la part d’un composant du système. Elle est due à un événement non lié au processeur, comme une incompatibilité du firmware, une interruption du BUS système ou une interruption de lecture/écriture de la mémoire. En théorie, l’erreur peut être causée par n’importe quel composant, logiciel ou matériel du système.
Cet article présente les bonnes pratiques en matière de gestion de ces erreurs et est valable pour tous les serveurs PowerEdge.
Avertissement : ne retirez pas le processeur ! Les erreurs CPU IERR sont rarement causées par un dysfonctionnement du processeur et la référence au processeur est uniquement liée au module qui a signalé l’erreur. Malgré ce que vous pouvez lire sur certains sites Web ou forums de résolution des problèmes, il est impératif que vous ne supprimiez pas le processeur, sauf si vous êtes qualifié et équipé pour ce faire.
Identification d’une erreur CPU IERR dans le journal des événements
L’erreur interne du processeur suivante s’affiche dans le journal d’événements comme suit : « CPU 1 has an internal error (IERR) » ou « CPU 2 has an internal error (IERR) ».
Figure 1 : DSET indiquant l’erreur CPU IERR
Résoudre une erreur CPU IERR
Pour résoudre cette erreur, suivez un plan structuré de dépannage afin d’identifier le composant qui a provoqué l’erreur et la manière de la résoudre.
1.
Consultez les journaux d’événements système pour toute autre erreur se produisant en même temps que l’erreur CPU IERR.
2. Résolvez d’abord toute autre erreur identifiée. La manière de résoudre les erreurs dépend de l’erreur identifiée.
3. Mettez à jour le micrologiciel du BIOS et iDRAC avec la dernière version.
- La mise à jour du BIOS ou de l’iDRAC à l’aide de l’interface iDRAC est expliquée dans cet article.
- Si l’iDRAC n’est pas disponible, d’autres méthodes de mise à jour sont répertoriées dans l’article didacticiel suivant.
4. Effacez le journal d’événements système : dans Open Manage Server Administrator ou dans l’iDRAC (dans les deux cas, ouvrez le journal d’événements, faites défiler vers le bas et appuyez sur clear log [effacer le journal]), les anciennes erreurs CPU IERR entraînent une alerte lorsque le message d’erreur a été résolu, sauf si elles sont effacées dans le journal d’événements du système.
5. Si aucune erreur n’est détectée ou que l’erreur CPU IERR persiste, arrêtez le système, retirez le câble d’alimentation et maintenez le bouton d’alimentation du serveur enfoncé pendant 20 secondes avant de rebrancher le câble d’alimentation et de mettre à nouveau le système sous tension. Ce processus est appelé déchargement de l’électricité résiduelle.
6. Si l’erreur persiste, contactez le support technique pour obtenir une aide supplémentaire. Les options de contact sont fournies ci-dessous.
Problèmes de système d’exploitation
Certains événements du système d’exploitation peuvent entraîner l’enregistrement d’une erreur CPU IERR dans le journal d’événements du système. Ces événements sont, notamment :
- erreurs fatales du noyau,
- interactions avec un programme tiers,
- arrêts critiques d’exécution, ou
- surengagement de la ressource.
Cela est dû au fait que le processeur identifie le processus comme étant non reconnu et répond par une erreur CPU IERR.
Si l’erreur CPU IERR a été causée par un événement du système d’exploitation, le journal d’événements du système d’exploitation doit être contrôlé et comparé avec le journal d’événements du système du serveur, afin d’identifier l’événement du système d’exploitation qui a provoqué l’erreur CPU IERR. Une fois cet événement de système d’exploitation identifié, le fournisseur du système d’exploitation doit être contacté pour vous aider à résoudre le problème.