未解决
2 消息
0
69
单盘故障导致Raid卡下所有盘IO堵塞
服务器型号:DELL R740XD(24盘位)
BIOS版本:2.9.4,2.10.2
RAID卡型号:PERC H330 Adapter
RAID卡信息:固件版本 25.5.9.0001,驱动程序版本 07.714.04.00-rh1
虚拟磁盘组:
Virtual Disk0:2块机械硬盘组的raid1。
Virtual Disk1:2块intel固态硬盘组的raid1。
Virtual Disk2:20块intel固态硬盘组的raid10。
三个虚拟磁盘组 共用一块RAID卡。
现象:Virtual Disk2中的一块盘故障,导致Virtual Disk0、Virtual Disk1、Virtual Disk2 都不可用。linux系统中磁盘的util全部达到100%。感觉就像是卡住了。持续几十秒后,就自动恢复了。
问题:请问这是正常的现象吗?这样影响也太大了?是否有好的方法能够解决此问题。
硬盘故障时的系统日志:
Jan 11 22:07:23 bjevca-db2 kernel: megaraid_sas 0000:af:00.0: scanning for scsi0...Jan 11 22:07:23 bjevca-db2 kernel: megaraid_sas 0000:af:00.0: 2389 (758326033s/0x0001/CRIT) - VD 02/2 is now DEGRADEDJan 11 22:07:23 bjevca-db2 Server_Administrator: 2851 2405 - Storage Service Command timeout on physical disk: Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:23 bjevca-db2 Server_Administrator: 2851 2095 - Storage Service Unexpected sense. SCSI sense data: Sense key: 6 Sense code: 29 Sense qualifier: 0: Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:24 bjevca-db2 Server_Administrator: 2851 2405 - Storage Service Command timeout on physical disk: Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:24 bjevca-db2 Server_Administrator: 2851 2095 - Storage Service Unexpected sense. SCSI sense data: Sense key: 6 Sense code: 29 Sense qualifier: 0: Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:24 bjevca-db2 Server_Administrator: 2851 2405 - Storage Service Command timeout on physical disk: Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:25 bjevca-db2 Server_Administrator: 2851 2346 - Storage Service Error occurred: Error on PD 14(e0x20/s20) (Error f0).Part Number = : Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:25 bjevca-db2 Server_Administrator: 2851 2048 - Storage Service Device failed: Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:25 bjevca-db2 Server_Administrator: 2851 2123 - Storage Service Redundancy lost: Virtual Disk 2 (Virtual Disk2) Controller 0 (PERC H330 Adapter)Jan 11 22:07:25 bjevca-db2 Server_Administrator: 2851 2057 - Storage Service Degraded: Virtual Disk 2 (Virtual Disk2) Controller 0 (PERC H330 Adapter)
硬盘故障时的IO表现:
DELL-Leo
Community Manager
Community Manager
•
6.6K 消息
0
2024年1月15日 05:08
您好!
以前磁盘故障有这种情况发生吗?
这次故障换完磁盘后后续还有没有IO阻塞的情况发生?
一个是用dell认证的磁盘,保证磁盘和机器的兼容性。还一个是BIOS,raid卡等驱动固件升级一下再观察看看。
SunLucky
2 消息
0
2024年1月16日 00:25
@Leoll
1、之前未遇到过坏盘导致io阻塞现象的发生。
2、共有三台机器,每台机器都有出现过同样的坏盘导致io阻塞现象,后面换完新盘后,三台机器都还未出现坏盘。
3、硬盘已经购买了,暂时无法更换。我们后续先升级下bios raid卡的驱动在试试吧。
非常感谢您的支持啊。
DELL-Leo
Community Manager
Community Manager
•
6.6K 消息
0
2024年1月16日 02:59
@SunLucky
好的,后续有问题随时交流~