文章摘要
本文介绍如何识别在 NVMe SSD 用作 vSphere vSAN 磁盘时在其中安装 NVMe SSD 的插槽。
环境
本文使用的案例引用 vSphere Web 客户端中的 ESXi 存储设备作为示例。
本文中的步骤介绍如何确定在安装有多个 NVMe SSD 时,设备详细信息列表中显示的 NVMe SSD 设备安装在哪个插槽中。
本文将设备 "vmhba1:C0:T0:L0" 标识为示例。
目录
1.识别磁盘总线 ID
2.从 iDRAC CLI (racadm) 识别物理磁盘
由于已确认设备 C0:T0:L0 存在于 vmhba1 上,请使用以下 lspci
命令或 esxcli
命令确认目标 VMHBA 总线 ID。
下面列出了每个输出示例。
Lspci 输出示例:
[root:~] lspci |grep -i nvme
0000:86:00.0 Mass storage controller: Dell Express Flash NVMe [vmhba1]
0000:87:00.0 Mass storage controller: Dell Express Flash NVMe [vmhba2]
esxcli 输出示例:
[root:~] esxcli storage core adapter list |grep -i nvme
vmhba1 nvme link-n/a pscsi.vmhba1 Data Integrity (0000:86:00.0) Dell Express Flash
vmhba2 nvme link-n/a pscsi.vmhba2 Data Integrity (0000:87:00.0) Dell Express Flash
此结果确定 vmhba1 是总线 86 中安装的设备。
由于此数字为十六进制,因此,将其转换为十进制,而总线 134 是总线 ID。
使用 telnet 或 SSH 访问 iDRAC IP 地址并运行 racadm hwinventory
命令。
由于输出结果很大,因此如果要使用的终端软件具有输出保存功能,建议使用该功能。
按输出结果上的字符串 "NVMe" 进行搜索,并在搜索结果前后确认目标总线 ID。
虽然输出结果因服务器型号和/或配置而异,但输出结果可能与以下结果类似。
从输出示例中提取:
-------------------------------------------------------------------
[InstanceID: Disk.Bay.8:Enclosure.Internal.0-1:PCIeExtender.Slot.1]
Device Type = PCIDevice
LastUpdateTime = 2018-10-21T21:47:15
LastSystemInventoryTime = 2019-01-17T23:16:47
SlotType = PCI Express Gen 3 SFF-8639
SlotLength = 2.5 Inch Drive Form Factor
DataBusWidth = 4x or x4
Description = Express Flash NVMe XS1715 SSD 400GB
Manufacturer = Samsung Electronics Co Ltd
PCISubDeviceID = 1F95
PCISubVendorID = 1028
PCIDeviceID = A820
PCIVendorID = 144D
FunctionNumber = 0
DeviceNumber = 0
BusNumber = 134
DeviceDescription = PCIe SSD in Slot 8 in Bay 1
FQDD = Disk.Bay.8:Enclosure.Internal.0-1:PCIeExtender.Slot.1
InstanceID = Disk.Bay.8:Enclosure.Internal.0-1:PCIeExtender.Slot.1
-------------------------------------------------------------------
根据上面的输出示例,确定总线 134 上的 vmhba1:C0:T0:L0 是 NVMe SSD #8。
我们在现场看到这样的情况:硬件(TSR 日志)标记了处于错误状态的 NVMe 设备,而 vSAN 显示没有问题。 在这种情况下,标识 NVMe 设备的过程会反转。 但是,racadm hwinventory 会将所需信息拆分为多个位置。 要识别设备,请首先在文本中搜索设备序列号。 您将找到类似于以下内容的部分:
[InstanceID: Disk.Bay.7:Enclosure.Internal.0-2:PCIeExtender.Slot.3]
Device Type = PCIeSSD
DeviceDescription = PCIe SSD in Slot 7 in Bay 2
Slot = 7
RAIDType = Unknown
SystemEraseCapability = 2
FreeSizeInBytes = 0
RaidStatus = Unknown
HotSpareStatus = No
FailurePredicted = NO
NegotiatedSpeed = 8 GT/s
MaximumCapableSpeed = 8 GT/s
PCIeCapableLinkWidth = x4
PCIeNegotiatedLinkWidth = x4
ProductID = a822
DeviceProtocol = NVMe-MI1.0
State = Unknown
Manufacturer = SAMSUNG
PrimaryStatus = Error
Revision = 1.1.1
Model = Dell Express Flash PM1725a 3.2TB SFF
RemainingRatedWriteEndurance = 100%
MediaType = Solid State Drive
DriveFormFactor = 2.5 inch
SerialNumber = S3B0NX0JB00320
BusProtocol = PCIE
InstanceID = Disk.Bay.7:Enclosure.Internal.0-2:PCIeExtender.Slot.3
FQDD = Disk.Bay.7:Enclosure.Internal.0-2:PCIeExtender.Slot.3
SizeInBytes = 3200631791616
-------------------------------------------------------------------
请注意,在本例中,PrimaryStatus 处于错误状态。 记下 InstanceID。 进一步搜索文本文件以了解 InstanceID 的其他发生情况,直到找到类似于以下内容的片段:
[InstanceID: Disk.Bay.7:Enclosure.Internal.0-2:PCIeExtender.Slot.3]
Device Type = PCIDevice
SlotType = PCI Express Gen 3 SFF-8639
SlotLength = 2.5 Inch Drive Form Factor
DataBusWidth = 4x or x4
Description = Express Flash PM1725a 3.2TB SFF
Manufacturer = Samsung Electronics Co Ltd
PCISubDeviceID = 1FDB
PCISubVendorID = 1028
PCIDeviceID = A822
PCIVendorID = 144D
FunctionNumber = 0
DeviceNumber = 0
BusNumber = 102
DeviceDescription = PCIe SSD in Slot 7 in Bay 2
FQDD = Disk.Bay.7:Enclosure.Internal.0-2:PCIeExtender.Slot.3
InstanceID = Disk.Bay.7:Enclosure.Internal.0-2:PCIeExtender.Slot.3
LastUpdateTime = 2019-03-22T08:27:12
LastSystemInventoryTime = 2019-03-22T09:27:13
-------------------------------------------------------------------
在这里,您可以看到 BusNumber = 102。 然后,此 BusNumber 应转换为其十六进制值(在本例中为 66),然后可以像以前一样使用它来查找 vmhba。
如果您有任何问题或疑问,请联系技术支持,并提供 iDRAC 的 Support Assist 日志以及在“确认磁盘总线 ID”中确认的命令结果。
如果您在实际问题方面遇到困难,技术支持将确认问题,并安排工程师根据确定哪个物理磁盘存在问题或合同进行维修。
请参阅以下文章以收集 iDRAC 的 Support Assist 日志(两个步骤都不需要选中“OS and Application Data”选项)。