La solución de almacenamiento BeeGFS, diseñada para proporcionar un sistema de archivos scratch de alto rendimiento, utiliza los siguientes componentes de hardware:
El servidor de administración ejecuta el servicio de monitoreo de BeeGFS. El servidor de metadatos utiliza las 12 unidades en la zona NUMA 0 para alojar metadata targets (MDT), mientras que las 12 unidades restantes en la zona NUMA 1 alojan los destinos de almacenamiento (TB). No se utiliza un servidor de metadatos dedicado porque los requisitos de capacidad de almacenamiento para los metadatos de BeeGFS son muy pequeños. Los metadatos, los destinos de almacenamiento y los servicios están aislados en nodos NUMA independientes, de modo que se establece una separación considerable de las cargas de trabajo. Los servidores de almacenamiento utilizados en la configuración tienen tres servicios de almacenamiento que se ejecutan por zona NUMA, seis en total por servidor. Para obtener más detalles, consulte el blog de anuncios. La figura 1 muestra las dos configuraciones básicas que se probaron y validaron en el Laboratorio de innovación en HPC e IA de Dell EMC.
Figura 1: Configuraciones básicas
La configuración pequeña consta de tres servidores R740xd. Tiene un total de 15 objetivos de almacenamiento. La configuración media tiene servidores 6xR740xd y tiene un total de 33 destinos de almacenamiento. El usuario puede comenzar con una configuración "pequeña" o con la configuración "media" y puede agregar servidores de almacenamiento o metadatos según sea necesario para aumentar el espacio de almacenamiento y el rendimiento general, o la cantidad de archivos y el rendimiento de metadatos, respectivamente. La tabla 1 muestra los datos de rendimiento de las configuraciones básicas que se probaron y validaron exhaustivamente en el Laboratorio de innovación en HPC e IA de Dell EMC.
Configuración básica | Pequeño | Medio | |
---|---|---|---|
U total (MDS+SS) | 6U | 12U | |
Cantidad de servidores de almacenamiento dedicados | 2 | 5 | |
Cantidad de unidades NVMe para el almacenamiento de datos | 60 | 132 | |
Espacio útil estimado | 1,6 TB | 86 TiB | 190 TiB |
3,2 TB | 173 TiB | 380 TiB | |
6,4 TB | 346 TiB | 761 TiB | |
Lectura secuencial máxima | 60,1 GB/s | 132,4 GB/s | |
Escritura secuencial máxima | 57,7 GB/s | 120,7 GB/s | |
Lectura aleatoria | 1,80 millones de IOPS | 3,54 millones de IOPS | |
Escritura aleatoria | 1,84 millones de IOPS | 3,59 millones de IOPS |
Tabla 1: Detalles de capacidad y rendimiento de las configuraciones básicas
En la fórmula anterior, 0.99 es el factor que llegó suponiendo conservadoramente que hay una sobrecarga del 1 % del sistema de archivos. Para llegar a la cantidad de unidades para el almacenamiento, también se incluyen 12 unidades de MDS. Esto se debe a que, en MDS, las 12 unidades en la zona 0 numa se utilizan para los metadatos y las 12 unidades en la zona 1 numa se utilizan para el almacenamiento. El último factor de la fórmula 10^12/2^40 es convertir el espacio utilizable de TB a TiB.
Espacio utilizable de BeeGFS en TiB= (0,99* n.º de unidades* tamaño en TB * (10^12/2^40)
Configuración | Pequeño | Pequeño +1 | Pequeño +2 | Medio | Media +1 | |
---|---|---|---|---|---|---|
U total (MDS+SS) | 6U | 8U | 10U | 12U | 14U | |
Cantidad de servidores de almacenamiento dedicados | 2 | 3 | 4 | 5 | 6 | |
Cantidad de unidades NVMe para el almacenamiento de datos | 60 | 84 | 108 | 132 | 156 | |
Espacio útil estimado | 1,6 TB | 86 TiB | 121 TiB | 156 TiB | 190 TiB | 225 TiB |
3,2 TB | 173 TiB | 242 TiB | 311 TiB | 380 TiB | 449 TiB | |
6,4 TB | 346 TiB | 484 TiB | 622 TiB | 761 TiB | 898 TiB | |
Lectura secuencial máxima | 60,1 GB/s | 83,3 GB/s | 105,2 GB/s | 132,4 GB/s | 152,9 GB/s | |
Escritura secuencial máxima | 57,7 GB/s | 80,3 GB/s | 99,8 GB/s | 120,7 GB/s | 139,9 GB/s |
Tabla 2: Detalles de capacidad y rendimiento de las configuraciones escaladas
El pool de almacenamiento al que se hace referencia se creó solo con el propósito explícito de caracterizar el rendimiento de diferentes configuraciones. Mientras se realizaba la evaluación del rendimiento de la configuración media detallada en el blog del anuncio, los 33 destinos estaban solo en el "pool predeterminado". La salida del comando beegfs-ctl --liststoragepools que se muestra a continuación muestra la asignación de los destinos de almacenamiento:
# beegfs-ctl --liststoragepools Pool ID Descripción del pool Destinos
Grupos
de amigos======= ================== ============================ ============================
1 Predeterminado 1,2,3,4,5,6,7,8,9,10,11,12,
13, 14, 15, 16, 17, 18, 19, 20, 21,
22, 23, 24, 25, 26, 27, 28, 29, 30,
31, 32, 33
[1] Dell EMC Ready Solutions for HPC BeeGFS Storage:
https://www.dell.com/support/article/sln319381/[2] Documentación de BeeGFS:
https://www.beegfs.io/wiki/[3] Cómo conectar dos interfaces en la misma subred:
https://access.redhat.com/solutions/30564[4] Diseño de referencia de acceso a la memoria PCI Express Direct mediante memoria externa: https://www.intel.com/content/www/us/en/programmable/documentation/nik1412547570040.html#nik1412547565760