Consideraciones
Siempre que sea posible, los discos se deben reemplazar siguiendo el procedimiento Solve. Las partes autorizadas pueden acceder a estos procedimientos desde el portal
SolVe Online.
Por lo general, los pasos para reemplazar manualmente las unidades mediante vCenter Web Client son visibles. Los pasos para actualizar manualmente la base de datos de VXRM son visibles solo para los empleados y partners de Dell Technologies.
Para los clientes, soporte de campo, etc. que necesiten ayuda con discos de reemplazo enviados como una unidad reemplazable de cliente (CRU), cuando la opción de reemplazo de hardware de VxRail Manager falló o no está disponible, abra una SR con el soporte remoto de VxRail y consulte este artículo. Una SR recomendada sería de gravedad 2 o 3 configurada como tipo "Hardware". Un resumen de SR adecuado puede ser: “Reemplazo de unidades de VxRail, se necesita asistencia del soporte de VxRail”.
Hay tres escenarios posibles para fallas de unidad y diferentes enfoques cuando se quita y se vuelve a agregar a vSAN:
- Las unidades de capacidad fallaron (Quite el disco; obtenga más detalles en el paso 2)
- Las unidades de caché fallaron (quite el grupo de discos; obtenga más detalles en el paso 2; esto elimina todas las unidades de vSAN y se deben agregar al nuevo grupo de discos que se volvió a crear más adelante; encontrará más detalles en el paso 5)
- La unidad de caché o de capacidad falló y la opción de desduplicación y compresión está habilitada (Quitar grupo de discos; esto elimina todas las unidades de vSAN y se deben agregar al nuevo grupo de discos que se volvió a crear más adelante; más detalles en el paso 5)
Paso 1. Identificación del disco defectuoso:
Cómo identificar la ranura física de un disco fallido cuando es desconocido (por ejemplo, cuando vCenter marcó un disco como fallido, pero iDRAC/VxRail Manager no).
Puede identificar el disco fallido mediante vCenter Client.
- Haga clic en la vista hosts y clústeres.
- Haga clic en el nivel del clúster en el panel izquierdo.
- Haga clic en Configure (Manage en versiones anteriores) > vSAN > Disk Management.
- En el panel Disk Groups, busque el grupo de discos con el disco con errores y haga clic en el grupo de discos para mostrar los discos individuales en la sección Disk Group Disks que aparece a continuación.
- Hay dos opciones diferentes para identificar o confirmar el disco con errores:
- Identificación mediante parpadeo del LED:
- Haga clic en el disco con errores en la sección Disk Group Disks.
- A continuación, haga clic en los tres puntos (...) y seleccione Encender LED.
- Identificación mediante número naa:
NOTA: Por lo general, los discos con errores muestran el UUID de vSAN en lugar de naa.
- Puede usar SSH para el host a fin de intentar obtener el número de NAA. # del disco haciendo coincidir con el UUID de vSAN:
# vdq -qH
Muestra el # de naa y el UUID de vSAN cuando puede:
# esxcli vsan storage list
Muestra el naa #, el UUID de vSAN y el UUID del grupo de discos cuando puede:
Si ninguno de los dos puede mostrar el # de naa para el UUID de vSAN asociado, puede utilizar el siguiente método para determinar el naa del disco mediante el proceso de eliminación.
- Observe los números naa de los otros discos del grupo de discos que registran los últimos 4 a 6 números del número. Si hay varios grupos de discos en el host, hágalo para todos los grupos de discos.
- En la vista física del host de VxRail Manager, correlacione los números de NAA de vCenter con los números de GUID en VxRail Manager.
- Busque hasta que encuentre el disco con un número de NAA. que no esté en la lista. Este es el disco con errores.
Paso 2. Quitar disco o grupo de discos:
Comprobaciones previas:
Es una “práctica recomendada” asegurarse de que todas las máquinas virtuales (VM, por sus siglas en inglés), incluidas las VM de servicio, tengan respaldos actualizados (fuera del clúster) antes de realizar este tipo de mantenimiento. El clúster debe estar en buen estado, aparte de las alertas relacionadas con las unidades fallidas que se reemplazan antes de comenzar. Este procedimiento
NO se debe realizar si vSAN no tiene suficiente espacio restante para la funcionalidad completa sin uno o más grupos de discos que necesitan corrección.
- En el cliente web de vCenter, en la vista "Hosts y clústeres", coloque el host en modo de mantenimiento mediante Ensure Accessibility. Haga clic con el botón secundario en el host y haga clic en Ingresar al modo de mantenimiento.
- Seleccione el clúster y vaya a Configure (o "Manage" en versiones anteriores) > Settings > Disk Management. (Aquí se quita el disco antiguo).
-
Cómo quitar un disco de un grupo de discos:
NOTA: Si el cliente utiliza desduplicación y compresión, las unidades de capacidad individuales no se pueden quitar ni reemplazar individualmente, el grupo de discos se debe quitar y volver a crear. Se pueden agregar más unidades de capacidad a grupos de discos comprimidos y desduplicados sin volver a crear el grupo de discos.
NOTA: Si la unidad fallida es una unidad de nivel de caché, el grupo de discos se debe quitar y volver a crear.
- En el panel Disk Groups, desplácese hasta el host correcto y seleccione el grupo de discos que tiene el disco con errores.
- Encima de la lista de hosts, hay un botón View Disks.
- Abra la lista de las unidades en el grupo de discos con la unidad afectada y selecciónela.
- Haga clic en el botón Remove disk sobre la lista de unidades. Se muestra una ventana con opciones para "migración de datos completa", "garantizar la accesibilidad" y "sin migración de datos" (la redacción depende de la versión). El host ya debe estar en modo de mantenimiento con "Garantizar la accesibilidad" del paso 1 anterior, por lo que todos los datos de objetos de VM en todo el host deben tener una copia o existir en otro lugar del clúster. Seleccione "No Data Migration" para esta parte. A continuación, haga clic en Remove.
- Espere a que se complete la tarea "Eliminar discos para que Virtual SAN los utilice". Vaya a Monitorear > tareas para ver el progreso.
-
Cómo eliminar un grupo de discos completo:
Si la unidad fallida es una unidad de nivel de caché, el grupo de discos se debe quitar y volver a crear.
- En el panel Disk Groups, desplácese hasta el host correcto y seleccione el grupo de discos que tiene el disco con errores.
- Seleccione el grupo de discos correcto y haga clic en los tres puntos que lo preceden.
- En Menú, haga clic en Quitar. Se muestra una ventana con opciones para "migración de datos completa", "garantizar la accesibilidad" y "sin migración de datos" (la redacción depende de la versión). El host ya debe estar en modo de mantenimiento con "Garantizar la accesibilidad" del paso 1 anterior, por lo que todos los datos de objetos de VM en todo el host deben tener una copia o existir en otro lugar del clúster. Seleccione "No Data Migration" para esta parte. A continuación, haga clic en Remove.
- Espere a que se complete la tarea "Eliminar discos para que Virtual SAN los utilice". Vaya a Monitorear > tareas para ver el progreso.
Paso 3. Reemplace físicamente los discos con fallas:
El procedimiento de SolVe contiene información sobre las precauciones de seguridad y cómo realizar este paso. Debe desconectar el portaunidades del disco con errores y colocar el disco de reemplazo en él, ya que, por lo general, las unidades de reemplazo no se envían con portaunidades. El host aún debe estar en MM para este paso a fin de evitar la eliminación accidental de la unidad incorrecta, mientras que el tráfico de I/O podría ser posible. Para reducir aún más el riesgo, apague el host antes de reemplazar físicamente la unidad, aunque esto no se considera necesario.
Paso 4. Marque los discos nuevos como locales:
- Seleccione el host en el navegador y vaya a Manage > Storage > Storage Devices.
- Seleccione el disco correcto en el panel central "Storage Devices". Debe ser el dispositivo con Type disk y no assigned Datastore.
- Seleccione la opción correcta de arriba para marcar el dispositivo como local. Si la opción disponible es marcar como "Remote", el disco ya es local.
Paso 5. Agregar nuevos discos o grupos de discos:
Asegúrese de que el disco esté marcado como local antes de agregar un disco o volver a crear un grupo de discos.
- Seleccione el clúster y vaya a Configure (o "Manage" en versiones anteriores) > Settings > Disk Management. (Aquí se agrega el nuevo disco).
-
Cómo agregar un disco a un grupo de discos:
Nota: Se pueden agregar unidades de capacidad adicionales a grupos de discos comprimidos y desduplicados sin volver a crear el grupo de discos.
- En el panel Disk Groups, desplácese hasta el host correcto y seleccione el grupo de discos al que se agrega el nuevo disco.
- Seleccione el grupo de discos correcto y haga clic en los tres puntos que lo preceden.
- En el menú que aparece, seleccione Add Disks. En la ventana de visualización, marque las unidades (si las unidades no se muestran en esta ventana, compruebe que la unidad esté marcada como local) y haga clic en Agregar.
- Espere a que se complete la tarea "Agregar discos para que los use Virtual San". Vaya a Monitorear > tareas para ver el progreso.
- Actualice en la parte superior de la página y asegúrese de que los grupos de discos se vean correctos (los discos en uso tienen un número preciso, el estado muestra montado).
- Cómo agregar o volver a crear un grupo de discos completo:
- En el panel Disk Groups, desplácese hasta el host correcto en el que se crea el grupo de discos.
- Sobre el panel Disk Groups, haga clic en el botón Create Disk Group.
- En la ventana que aparece, seleccione el disco de caché en la sección Cache Tier, seleccione una o más unidades de capacidad en la sección Capacity Tier y haga clic en "OK".
- Espere a que se complete la tarea “Add disks for use by Virtual San”. Vaya a Monitorear> tareas para ver el progreso.
- Actualice en la parte superior de la página y asegúrese de que los grupos de discos se vean correctos (los discos en uso tienen un número preciso, el estado muestra montado).
NOTA: En este punto, vCenter y el host deben mostrar “In Use for VSAN” en el disco y que se encuentra en buen estado. La base de datos de VxRail Manager aún podría contener información obsoleta sobre el disco antiguo que se reemplazó, lo que muestra un disco faltante en la página Physical Health. VxRail Manager ahora también se puede actualizar de manera manual para quitar las unidades antiguas y agregar nuevas a su base de datos, de modo que las nuevas se muestren en Physical Health. El soporte de VxRail puede realizar este procedimiento a través de una solicitud de servicio.