Commencer une nouvelle conversation

Non résolu

D

6  messages

573

26 septembre 2022 07:00

R240 - Erreur disque sur position spécifique câble

Bonjour à tous,

Petit problème sur mon R240.

J'ai proxmox d'installé sur ce serveur avec 4 disques dur (tous via le Perc H330 mais en mode non-raid) :
- P0 : disque Dell 1To me servant pour mes backups Proxmox (mode non-raid)
- P1 : Disque 2To en zfs via proxmox (mode non-raid)
- P2 : Disque 2To en zfs via proxmox (mode non-raid)
- P3 : SSD système où est installé Proxmox (mode non-raid)

Le système fonctionne très bien mais de manière aléatoire depuis plusieurs mois, Proxmox détecte un souci sur son disque système (le ssd en P3 donc...) et :
- Soit crash complètement car le disque système disparaît complètement du R240. Il n'apparait même plus dans l'iDrac (mais parfois si). Si je fais un redémarrage simple du R240, le disque est toujours non détecté. Je suis obligé d'éteindre tout, débrancher le SSD, attendre un peu, rebrancher le SSD puis redémarrer. A ce moment là, le SSD est de nouveau détecté.
- Sois il remonte le ssd en lecture seule (pas de crash de proxmox mais mode dégradé non stable). Et là, pareil, je suis obligé de tout éteindre, débrancher le disque...

Dans les logs Proxmox, il n'y a rien indiquant que le problème va survenir et proxmox ne fait rien de particulier à ce moment là. Il ne fait même rien dans certain cas. Mes VM continues de fonctionner normalement (sauf si proxmox crash évidement) car montées sur les disques ZFS.

Je précise que ce phénomène se produit QUELQUES SOIT le SSD/disque utilisé, j'ai tenté des SSD Samsung 860 evo et 960 mais également des Sandisk. Tous les disques on été installé sur un autre système avec un check complet à l'aide de Smart et, evidement aucun souci.

En dernier test et pour en avoir le cœur net, j'ai inversé le disque P0 avec le P3, au bout de quelques jours, exactement les mêmes problèmes mais toujours sur la position 3 (disque en P3) où dans ce cas, c'était donc le disque Dell 1To qui était branché. Et du coup impossible a proxmox d’effectuer ses sauvegardes, par contre RAS au niveau du disque système (qui du coup, branché en P0)

Je sais pas si je suis assez clair ?


En résumé, les problèmes surviennent toujours sur le disque qui est connecté à la dernière position du câble venant de la carte RAID (P3). Pour moi soit il y a un soucis au niveau du câble, éventuellement au niveau de la carte RAID.

Quelqu'un pourrait éventuellement me confirmer ma théorie ?
Le serveur est neuf, a peine 1 an mais le SAV refuse la prise en garantie me soutenant que c'est un problème logiciel (de Proxmox)


Merci

Moderator

 • 

3.5K  messages

27 septembre 2022 01:00

Bonjour les disques sont d'origine?

Promox n'est pas supporté sur ce serveur, du coup on ne peut pas déterminer si la cause est le système d'exploitation ou un problème hardware.

Pour vérifier cela vous pouvez essayer avec un seul disque dur (celui d'origine) et un OS supporté?

Merci

6  messages

27 septembre 2022 08:00

Bonjour,

Seul le disque Dell de 1To est d'origine.
Et non je ne peux pas malheureusement, ce serveur est en prod.

Comme expliqué, le problème disque survient systématiquement sur le même emplacement physique dans le serveur : position P3 sur le câble indépendamment du disque branché.

Actuellement j'ai juste débranché le disque Dell (qui sert a proxmox pour ses backups) et j'ai branché mon disque système (normalement en P3) en lieu est place en P0. Du coup rien n'est connecté en P3, le serveur tourne sans problème depuis 3 jours (bon proxmox rouspete car son disque de backup est introuvable).


Le fait que le problème se pose TOUJOURS sur le disque branché en P3 sur le câble et ce, quelque soit la fonction du disque, laisse quand même plus que penser à un problème matériel ?

Merci,

Moderator

 • 

3.5K  messages

28 septembre 2022 00:00

cela pourrait également être le fait que les pilotes du contrôleur ne parviennent pas à communiquer correctement avec le matériel, juste à cet endroit.
Malheureusement je m'aligne sur ce qui est préconisé par notre support technique, il faut vérifier avec l'état d'origine et un système supporté pour tirer des conclusions.

6  messages

28 septembre 2022 10:00

Mmmmmhh ok ok

Comme je ne suis pas complètement borné je vais tenter une autre approche.
J'ai configuré la carte H330 en mode HBA au lieu de RAID (puisque de toute façon j'avais conf tous mes disques en JBOD).

J'ai tout rebranché niveau disque, wait and see...
Avec un peu de chance cela corrigera le problème.

Merci

6  messages

30 septembre 2022 02:00

Bonjour,

 

Après 2 jours de fonctionnement sans problème. Le souci s'est de nouveau déclenché...
Même en mode HBA l'erreur disque sur la position P3 est réapparu.

Je commence a désespérer...

 

Moderator

 • 

3.5K  messages

30 septembre 2022 07:00

C'est possible pour vous faire le test avec le OS supporté et le disque d'origine? 

Comme ça on peut déterminer si il s'agit d'un probleme hardware.

Merci

6  messages

30 septembre 2022 08:00

Et non malheureusement, sur le disque d'origine est stocké tous mes backups de plus, les VMs de proxmox gère toute l'infra (routeur, firewall, domotique, rsyslog...) je ne peux pas couper tout cela, je l'aurais déjà testé sinon.
A tout hasard j'ai débranché le disque Dell (suite a mon message de tout à l'heure), histoire de voir si le nombre de disque connecté avait une influence. Le souci est réapparut même pas 2h plus tard
Le nombre de disque n'a donc aucun impact.

 

J'ai vu qu'il y avait un connecteur SAS sur la carte mère, j'imagine qu'il doit exister un câble qui me permettrait de brancher mes disques (tout en me passant de la carte H330) ?
Il y aurait des effets de bords de passer via ce connecteur ? (si câble il existe!)

Merci

Moderator

 • 

3.5K  messages

3 octobre 2022 01:00

Bonjour, je ne suis pas en mesure de vous conseiller de contourner le contrôleur.
Notre support, comme déjà mentionné ci-dessus, ne peut vous aider que si le serveur a une configuration logicielle et matérielle supportée, c'est-à-dire comme à l'origine.
Toute autre méthode non officielle ou solution de contournement n'est malheureusement pas recommandée par l'assistance.
Merci.

Aucun événement trouvé !

Top