注意事项
应尽可能按照 Solve 流程更换磁盘。授权方可以从
SolVe Online门户访问这些过程。
使用 vCenter Web 客户端手动更换驱动器的步骤通常可见。手动更新 VXRM 数据库的步骤仅对 Dell Technologies 员工和合作伙伴可见。
对于客户、现场支持人员等,如果需要帮助更换作为客户可更换部件 (CRU) 发货的磁盘,当 VxRail Manager 的硬件更换选项出现故障或不可用时,请通过 VxRail 远程支持创建 SR 并参考本文。建议的 SR 严重性级别为 2 或 3,设置为“硬件”类型。正确的 SR 摘要可能是:“VxRail 驱动器更换,需要 VxRail 支持的协助”。
在移除驱动器并将其重新添加到 vSAN 时,有三种可能的驱动器故障情况和不同的方法:
- 容量 驱动器出现故障(卸下磁盘,有关步骤 2 的更多详细信息)
- 缓存 驱动器出现故障(删除磁盘组有关步骤 2 的更多详细信息,这将从 vSAN 中删除所有驱动器,以后必须将它们添加到重新创建的新磁盘组,更多详细信息参见步骤 5)
- 高速缓存或容量驱动器出现故障,并且启用了重复数据消除和压缩选项(删除磁盘组,这将从 vSAN 中删除所有驱动器,并且以后必须将它们添加到新的重新创建的磁盘组中,有关步骤 5 的更多详细信息)
步骤1.识别故障磁盘:
如何在故障磁盘未知时(例如,vCenter 已将磁盘标记为故障,但 iDRAC/VxRail Manager 尚未标记为故障时)识别该磁盘的物理插槽。
您可以使用 vCenter Client 识别故障磁盘。
- 单击 主机和群集视图。
- 单击左侧窗格中的 群集级别 。
- 单击 配置(在旧版本中为管理) > vSAN > 磁盘管理。
- 在 “Disk Groups”面板中,找到包含故障磁盘的磁盘组, 然后单击磁盘组 以在下面的“Disk Group Disks”部分中显示各个磁盘。
- 有两个不同的选项可用于识别和/或确认故障磁盘:
- 通过 LED 闪烁识别:
- 单击 Disk Group Disks部分中的故障磁盘。
- 然后单击三个点 (...) 并选择 打开 LED。
- 通过 naa 号识别:
提醒:故障磁盘通常显示 vSAN UUID 而不是 naa。
- 您可以使用 SSH 访问主机以通过与 vSAN UUID 匹配来尝试获取。磁盘的# (通过与 vSAN UUID 匹配获得):
# vdq -qH
如果可以,则同时显示 naa # 和 vSAN UUID:
# esxcli vsan storage list
显示磁盘组的 naa #、vSAN UUID 和 UUID(如果可以):
如果两者都不能显示关联 vSAN UUID 的 naa #,您可以使用以下方法通过 消除过程确定磁盘的 naa。
- 查看磁盘组中其他磁盘的 naa 编号,记录编号的最后 4-6 个数字。如果主机上有多个磁盘组,请对所有磁盘组执行此操作。
- 在 VxRail Manager 的主机物理视图中,将 vCenter 中的 naa 编号与 VxRail Manager 中的 GUID 编号关联。
- 搜索直至找到具有不在列表中的 naa.编号的磁盘。这就是故障磁盘。
步骤 2.移除磁盘或磁盘组:
预检查:
最佳实践是,在执行此类维护之前,确保包括服务虚拟机在内的所有虚拟机 (VM) 都有最新的备份(在群集外)。在开始前,群集应处于良好运行状况(与要更换的故障驱动器相关的警报除外)。如果在没有需要纠正的一个或多个磁盘组的情况下 vSAN 没有足够的剩余空间来实现完整功能,则
不得执行 此过程。
- 在 vCenter Web Client 的“主机和群集”视图中,使用 “Ensure Accessibility”将主机置于维护模式。右键单击主机,然后单击进入维护模式。
- 选择群集,然后转至 Configure(在旧版本中为“Manage”) > SettingsDisk > Management。(在这里删除旧磁盘。)
-
如何从磁盘组中删除磁盘:
提醒:如果客户使用重复数据消除和压缩,则不能逐个删除/更换容量驱动器,必须删除并重新创建磁盘组。可以将更多容量驱动器添加到经过重复数据消除和压缩的磁盘组,而无需重新创建磁盘组。
提醒:如果故障驱动器是 高速缓存层驱动器, 则必须删除并重新创建磁盘组。
- 在“Disk Groups”面板中,滚动到正确的主机,然后选择包含故障磁盘的 磁盘组 。
- 在主机列表上方,有一个 View Disks按钮。
- 打开包含受影响驱动器的磁盘组下的驱动器列表,然后选择它。
- 单击驱动器列表上方的 Remove disk按钮。此时将显示一个窗口,其中包含“full data migration”、“ensure accessibility”和“no data migration”选项(措辞因版本而异)。主机应已使用上面步骤 1 中的“Ensure Accessibility”置于维护模式,因此整个主机上的所有虚拟机对象数据都应具有拷贝或存在于群集中的其他位置。为此部件选择“No Data Migration”。然后单击 Remove。
- 等待“Remove disks from use by Virtual San”任务完成。转至 监视 > 任务 以查看进度。
-
如何删除整个磁盘组:
如果故障驱动器是高速缓存层驱动器,则必须删除并重新创建磁盘组。
- 在“Disk Groups”面板中,滚动到正确的主机,然后选择包含故障磁盘的磁盘组。
- 选择正确的磁盘组,然后单击其前面的三个点。
- 在“Menu”(菜单)上,单击Remove(删除)。此时将显示一个窗口,其中包含“full data migration”、“ensure accessibility”和“no data migration”选项(措辞因版本而异)。主机应已使用上面步骤 1 中的“Ensure Accessibility”置于维护模式,因此整个主机上的所有虚拟机对象数据都应具有拷贝或存在于群集中的其他位置。为此部件选择“No Data Migration”。然后单击 Remove。
- 等待“Remove disks from use by Virtual San”任务完成。转至 监视 > 任务 以查看进度。
步骤 3.以物理方式更换故障磁盘:
Solve 过程包含有关安全预防措施以及如何执行此步骤的信息。您必须将托架与故障磁盘分离,并将更换磁盘放入托架中,因为更换驱动器发货时通常不附带托架。对于此步骤,主机应该仍处于维护模式,以避免在可能出现 I/O 流量时意外删除错误的驱动器。为了进一步降低风险,请先关闭主机电源,然后再实际更换驱动器(尽管这不是必需的)。
步骤4.将新磁盘标记为本地:
- 在导航器中选择主机,然后转至 Manage > StorageStorage > Devices。
- 在 “Storage Devices” 中间面板中选择正确的磁盘。它应该是类型为 disk 且未分配数据存储的设备。
- 从上方选择正确的选项,将设备标记为本地。如果可用选项是标记为 “Remote”,则表示磁盘已是本地磁盘。
步骤5.添加新磁盘或磁盘组:
在添加磁盘或重新创建磁盘组之前,请确保磁盘标记为本地。
- 选择群集,然后转至Configure(在旧版本中为“Manage”) > SettingsDisk > Management。(在这里添加新磁盘。)
-
如何将磁盘添加到磁盘组:
提醒:可以将额外的容量驱动器添加到经过重复数据消除和压缩的磁盘组,而无需重新创建磁盘组。
- 在 “Disk Groups”面板中,滚动到正确的主机,然后选择要将新磁盘添加到的 磁盘组 。
- 选择正确的 磁盘组 ,然后单击其前面 的三个点 。
- 在显示的菜单中,选择 Add Disks。在显示窗口中 标记驱动器(如果此窗口中未显示驱动器,请检查驱动器是否标记为本地),然后单击 Add。
- 等待“Add disks for use by Virtual San”任务完成。转至 监视 > 任务 以查看进度。
- 刷新页面顶部,并确保磁盘组看起来正确(Disks in Use具有准确的编号,State显示Mounted)。
- 如何添加或重新创建整个磁盘组:
- 在“Disk Groups”面板中,滚动到创建磁盘组的正确主机。
- 在“磁盘组”面板上方,单击 创建磁盘组按钮。
- 在出现的窗口中,在“Cache Tier”部分中选择高速缓存磁盘,然后在“Capacity Tier”部分中选择一个或多个容量驱动器,然后单击“OK”。
- 等待任务“Add disks for use by Virtual San”完成。转至 监视> 任务 以查看进度。
- 刷新页面顶部,并确保磁盘组看起来正确(Disks in Use具有准确的编号,State显示Mounted)。
提醒:此时,vCenter 和主机应显示磁盘“In Use for VSAN”且运行状况良好。VxRail Manager 数据库仍将保存有关已更换的旧磁盘的过时信息,在“物理运行状况”页面上显示缺失的磁盘。您现在也可以手动更新 VxRail Manager,以删除旧驱动器并将新驱动器添加到其数据库,使新驱动器显示在“Physical Health”中。VxRail 支持可以通过服务请求执行此过程。