Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products

如何处理PowerEdge服务器的虚拟磁盘上的穿孔(坏块)

Summary: 对带有 PERC 控制器的 PowerEdge 服务器中硬盘上的(穿孔)坏块进行故障排除的步骤。尤其是没有进行备份时,以下信息可能有助于将受影响的虚拟磁盘恢复到最优状态。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

-

Cause

-

Resolution

本文提供对带有 PERC 控制器的 PowerEdge 服务器中硬盘上的(穿孔)坏块进行故障排除的步骤。尤其是没有进行备份时,以下信息可能有助于将受影响的虚拟磁盘恢复到最优状态。



目录:

  1. 故障描述

  2. 原因是什么

  3. 解决问题的步骤

  4. 其他信息


 



1.故障描述

 

故障 1:


OpenManage Server Administrator (OMSA) 在虚拟磁盘前面显示红色叉号(图 1)。  

SLN111146_en_US__11343098652871.1
图 1:状态中显示红色叉号的虚拟磁盘(示例 H800)

SLN111146_en_US__2icon 提醒:Dell OpenManage Server Administrator (OMSA)提供完整的一对一系统管理解决方案。OMSA 可以分为两个应用程序:
集成式 — 基于网页浏览器的图形用户界面 (GUI)
命令行界面 (CLI) — 通过操作系统


 


故障 2:


Windows 系统日志中显示坏块错误(图 2)。  

SLN111146_en_US__31343098674763.2 
图 2:Windows 系统日志中显示的坏块错误
 


 


故障 3:


RAID 控制器日志 (TTYLOG) 显示如下错误:  

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

警告:控制器日志 (TTYLOG) 可能显示无任何错误。

 



2.原因是什么:


RAID阵列并非不受数据错误的影响。  RAID控制器和硬盘固件包含检测并纠正多种类型的数据错误的功能,避免这些错误被写入阵列/驱动器。  使用过时的固件可能会导致不正确的数据写入阵列/驱动器,因为它缺少最新固件版本中提供的错误处理/纠错功能。
数据错误也可能由于物理坏块导致。  例如,当读/写磁头影响旋转盘片(称为“磁头崩溃”)时,可能会发生这种情况。  由于盘片在特定位置以磁性方式存储位的功能退化,块也可能随着时间的推移变坏。  由盘片退化导致的坏块通常可成功读取。  这种坏块只可能被间歇性地检测到,或使用驱动器上的扩展诊断程序检测到。  

坏块也称为坏逻辑块地址(LBA),它也可能由逻辑数据错误导致。  当数据被错误写入驱动器时,即使报告为成功写入,也会发生这种情况。  此外,存储在驱动器上的正常数据可能在无意中被更改。  例如“位翻转”,当读/写磁头通过或写入附近位置,导致以0和1形式显示的数据更改为其它值时,可能会发生位翻转。  这种情况可导致数据的“一致性”受损。  特定块上的数据的值与原始数据不同,可能不再与数据的校验和匹配。  物理 LBA 良好,可以成功写入,但当前包含不正确的数据,可能会被解释为坏块。

有关更多信息,请阅读我们关于 RAID 阵列中的双重故障和穿孔的文章。
 



3.解决问题的步骤:
 

SLN111146_en_US__2icon 提醒:虚拟磁盘上的当前数据已损坏,必须删除
  1. 文件级别上创建经过验证的数据备份
     

    • 基于块的备份会传承问题
    • 文件级备份可指出损坏的文件(这些文件应无法备份)
    • 如果已经存在穿孔条带,则不能 100% 保证留存所有数据
     

     

  2. 确保更换所有显示预测性故障的故障驱动器
     

  3. 删除并重新创建虚拟磁盘
     

    • 此步骤将会删除虚拟磁盘中的所有数据
    • 删除阵列
    • 根据需要重新创建阵列
     

     

  4. 执行虚拟磁盘的全面初始化
     

    • 确保不选择“Fast Initialization”(快速初始化)
    • 只有全面(等于慢速)初始化才能解决问题
     

     

  5. 在新创建的虚拟磁盘上执行检查一致性
     

    • 如果检查一致性完成且没有错误,则说明阵列现在运行正常,已去除穿孔
     

     

  6. 现在可以将数据还原到运行良好的虚拟磁盘
     

  7. 建议:将所有硬盘固件升级到最新版本
     



4.其他信息

OMSA 提供清除坏块警告的功能。要清除坏块,建议执行以下步骤:

  • 当选择了验证选项执行虚拟磁盘备份时,可能会出现两种情况:

    • 备份操作在一个或多个文件上失败。在这种情况下,从以前的备份还原文件。还原文件后,继续执行下一步。
    • 备份操作完成,没有错误。这表示虚拟磁盘的写入部分没有坏块。
    SLN111146_en_US__2icon 提醒:如果您仍然收到坏块警告,则说明坏块位于非数据区域。

     
  • 运行巡检读取(在 OMSA 中的虚拟磁盘任务下),然后检查系统事件日志,确保未找到新的坏块。如果仍然存在坏块,请继续下一步。如果没有坏块,则会清除该状况。

    SLN111146_en_US__2icon 提醒:必须先停用自动巡检读取,然后才能在 OMSA 中看到手动运行此操作的选项。

     
  • 要清除这些坏块,请执行清除虚拟磁盘坏块任务。可以在 OMSA GUI 中或使用 cli 命令完成此操作:
    omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

    SLN111146_en_US__2icon 提醒:要获取控制器 ID 和虚拟磁盘 ID 的值,请键入 omreport storage controller 以显示控制器 ID,然后键入 omreport storage vdisk controller=ID 显示虚拟磁盘的 ID

     

Affected Products

Servers
Article Properties
Article Number: 000139277
Article Type: Solution
Last Modified: 18 Nov 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.