开始新对话

未解决

S

2 消息

69

2024年1月12日 06:36

单盘故障导致Raid卡下所有盘IO堵塞

服务器型号:DELL R740XD(24盘位)

BIOS版本:2.9.4,2.10.2

RAID卡型号:PERC H330 Adapter

RAID卡信息:固件版本 25.5.9.0001,驱动程序版本 07.714.04.00-rh1

虚拟磁盘组:

Virtual Disk0:2块机械硬盘组的raid1。

Virtual Disk1:2块intel固态硬盘组的raid1。

Virtual Disk2:20块intel固态硬盘组的raid10。

三个虚拟磁盘组 共用一块RAID卡。

现象:Virtual Disk2中的一块盘故障,导致Virtual Disk0、Virtual Disk1、Virtual Disk2 都不可用。linux系统中磁盘的util全部达到100%。感觉就像是卡住了。持续几十秒后,就自动恢复了。

问题:请问这是正常的现象吗?这样影响也太大了?是否有好的方法能够解决此问题。

硬盘故障时的系统日志:

Jan 11 22:07:23 bjevca-db2 kernel: megaraid_sas 0000:af:00.0: scanning for scsi0...Jan 11 22:07:23 bjevca-db2 kernel: megaraid_sas 0000:af:00.0: 2389 (758326033s/0x0001/CRIT) - VD 02/2 is now DEGRADEDJan 11 22:07:23 bjevca-db2 Server_Administrator: 2851 2405 - Storage Service  Command timeout on physical disk:  Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:23 bjevca-db2 Server_Administrator: 2851 2095 - Storage Service  Unexpected sense. SCSI sense data: Sense key:  6 Sense code: 29 Sense qualifier:  0:  Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:24 bjevca-db2 Server_Administrator: 2851 2405 - Storage Service  Command timeout on physical disk:  Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:24 bjevca-db2 Server_Administrator: 2851 2095 - Storage Service  Unexpected sense. SCSI sense data: Sense key:  6 Sense code: 29 Sense qualifier:  0:  Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:24 bjevca-db2 Server_Administrator: 2851 2405 - Storage Service  Command timeout on physical disk:  Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:25 bjevca-db2 Server_Administrator: 2851 2346 - Storage Service   Error occurred: Error on PD 14(e0x20/s20) (Error f0).Part Number = :  Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:25 bjevca-db2 Server_Administrator: 2851 2048 - Storage Service  Device failed:  Physical Disk 0:1:20 Controller 0, Connector 0Jan 11 22:07:25 bjevca-db2 Server_Administrator: 2851 2123 - Storage Service  Redundancy lost:  Virtual Disk 2 (Virtual Disk2) Controller 0 (PERC H330 Adapter)Jan 11 22:07:25 bjevca-db2 Server_Administrator: 2851 2057 - Storage Service  Degraded:  Virtual Disk 2 (Virtual Disk2) Controller 0 (PERC H330 Adapter)

硬盘故障时的IO表现:

Community Manager

 • 

6.6K 消息

2024年1月15日 05:08

您好!

 

以前磁盘故障有这种情况发生吗?

这次故障换完磁盘后后续还有没有IO阻塞的情况发生?

一个是用dell认证的磁盘,保证磁盘和机器的兼容性。还一个是BIOS,raid卡等驱动固件升级一下再观察看看。

2 消息

2024年1月16日 00:25

@Leoll

1、之前未遇到过坏盘导致io阻塞现象的发生。

2、共有三台机器,每台机器都有出现过同样的坏盘导致io阻塞现象,后面换完新盘后,三台机器都还未出现坏盘。

3、硬盘已经购买了,暂时无法更换。我们后续先升级下bios raid卡的驱动在试试吧。

非常感谢您的支持啊。

Community Manager

 • 

6.6K 消息

2024年1月16日 02:59

@SunLucky​  

好的,后续有问题随时交流~

找不到事件!

Top