Úložné řešení BeeGFS, které je navrženo tak, aby poskytovalo vysoce výkonný souborový systém s poškrábáním, používá následující hardwarové komponenty:
Server pro správu využívá monitorovací službu BeeGFS. Server metadat využívá 12 disků v zóně NUMA 0 k hostování cílů MetaData (MDT), zatímco zbývajících 12 disků na zóně NUMA 1 hostuje cíle úložiště (ST). Vyhrazený server metadat se nepoužívá, protože požadavky na kapacitu úložiště pro metadata BeeGFS jsou velmi malé. Cíle a služby metadat a úložišť jsou izolovány na samostatných uzlech NUMA tak, aby bylo navázáno významné oddělení pracovního zatížení. Servery úložišť použité v konfiguraci mají tři služby úložiště spuštěné podle zóny NUMA, celkem šest na server. Další podrobnosti naleznete v blogu o oznámení. Obrázek 1 znázorňuje dvě základní konfigurace, které byly testovány a ověřeny v laboratořích Dell EMC HPC and AI Innovation Lab.
Obrázek 1: Základní konfigurace
Malá konfigurace se skládá ze tří serverů R740xd. Má celkem 15 cílů úložiště. Střední konfigurace má servery 6xR740xd a má celkem 33 cílů úložiště. Uživatel může začít s konfigurací "Small" nebo konfigurací "Medium" a může přidat servery úložišť nebo metadat podle potřeby za účelem zvýšení úložného prostoru a celkového výkonu, resp. počtu souborů a metadat. Tabulka 1 uvádí údaje o výkonu základních konfigurací, které byly testovány a důkladně ověřeny v laboratořích Dell EMC HPC and AI Innovation Lab.
Základní konfigurace | Malé | Střední | |
---|---|---|---|
Celkem U (MDS+SS) | 6U | 12U | |
Počet vyhrazených úložných serverů | 2 | 5 | |
Počet disků NVMe pro ukládání dat | 60 | 132 | |
Odhadovaný využitelný prostor | 1,6 TB | 86 TiB | 190 TIB |
3,2 TB | 173 TiB | 380 TIB | |
6,4 TB | 346 TIB | 761 TIB | |
Maximální sekvenční čtení | 60,1 GB/s | 132,4 GB/s | |
Maximální sekvenční zápis | 57,7 GB/s | 120,7 GB/s | |
Náhodné čtení | 1,80 milionu IOPS | 3,54 milionu IOPS | |
Náhodný zápis | 1,84 milionu IOPS | 3,59 milionu IOPS |
Tabulka 1: Podrobnosti o kapacitě a výkonu základních konfigurací
Ve výše uvedeném vzorci nastal faktor 0,99, který předpokládá, že ze souborového systému vychází 1 % režie. Při příchodu na počet disků pro úložiště je zahrnuto také 12 disků z MDS. Důvodem je, že v rámci služby MDS se pro metadata používá 12 disků v zóně NUMA 0 a pro úložiště se používá 12 disků v zóně NUMA 1. Posledním faktorem ve formuli 10^12/2^40 je převedení využitelného místa z TB na Tb.
Využitelný prostor beeGFS v TiB= (0,99* počet disků* velikost v TB * (10^12/2^40)
Konfigurace | Malé | Malý +1 | Malý +2 | Střední | Střední +1 | |
---|---|---|---|---|---|---|
Celkem U (MDS+SS) | 6U | 8U | 10U | 12U | 14U | |
Počet vyhrazených úložných serverů | 2 | 3 | 4 | 5 | 6 | |
Počet disků NVMe pro ukládání dat | 60 | 84 | 108 | 132 | 156 | |
Odhadovaný využitelný prostor | 1,6 TB | 86 TiB | 121 TiB | 156 TiB | 190 TIB | 225 TiB |
3,2 TB | 173 TiB | 242 TiB | 311 TIB | 380 TIB | 449 TiB | |
6,4 TB | 346 TIB | 484 TiB | 622 TiB | 761 TIB | 898 TiB | |
Maximální sekvenční čtení | 60,1 GB/s | 83,3 GB/s | 105,2 GB/s | 132,4 GB/s | 152,9 GB/s | |
Maximální sekvenční zápis | 57,7 GB/s | 80,3 GB/s | 99,8 GB/s | 120,7 GB/s | 139,9 GB/s |
Tabulka 2: Podrobnosti kapacity a výkonu škálovaných konfigurací
Uvedený fond úložišť byl vytvořen pouze za explicitním účelem charakterizovat výkon různých konfigurací. Během hodnocení výkonu střední konfigurace podrobně popsaného v oznámení na blogu se všechny 33 cíle nacházely pouze v "výchozím fondu". Výstup příkazu beegfs-ctl --liststoragepools uvedený níže ukazuje přiřazení cílů úložiště:
# beegfs-ctl --liststoragepools
Pool ID Pool ID Pool Description Targets Group
======= ================== ============================ ============================
1 výchozí 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,
13, 14, 15, 16, 17, 18, 19, 20, 21,
22, 23, 24, 25, 26, 27, 28, 29, 30,
31, 32, 33
[1] Řešení Dell EMC Ready pro úložiště HPC BeeGFS:
https://www.dell.com/support/article/sln319381/[2] Dokumentace k zařízení BeeGFS:
https://www.beegfs.io/wiki/[3] Jak připojit dvě rozhraní ke stejné podsíti:
https://access.redhat.com/solutions/30564[4] Referenční design PCI Express Direct Memory Access s externí pamětí: https://www.intel.com/content/www/us/en/programmable/documentation/nik1412547570040.html#nik1412547565760