Konfigurace 64 výpočetních uzlů řešení Dell EMC Ready Solutions pro superpočítadla v přírodních vědách zvládne 194 genomů denně (50x hloubka pokrytí).
Přehled
Varianta volání je proces, pomocí kterého identifikujeme varianty od pořadových dat. Tento proces pomáhá určit, zda jsou v dané pozici v jednotlivých genomech a trankriptech vloženy jednotlivé nukleodické polyfingy (SNP), zasunutí a odstranění (indels) nebo strukturní varianty (SV). Hlavním cílem identifikace genomických odlišnost je odkaz na lidstvo. I když ne všichni lidstvo jsou spojeni s odchylkami ve variantě, volání ve variantě může poskytnout cenné pokyny pro tyisty, kteří pracují na konkrétní nemoci způsobené odchylkami v notebooku. BWA-GATK je jedním z výpočetních nástrojů nové generace sekvenování (NGS), které jsou navrženy k identifikaci bacilů a somatických dat NGS. Existuje několik variant nástrojů pro identifikaci a víme, že neexistuje jediný nástroj, který by fungoval dokonale (1). Zvolili jsme však GATK, který je jedním z nejoblíbenějších nástrojů jako náš srovnávací nástroj, který ukazuje, jak dobře mohou řešení Dell EMC Ready Solutions pro superpočítačky v přírodních vědách zpracovávat složité a obrovské úlohy NGS.
Účelem tohoto blogu je poskytnout cenné informace o výkonu procesoru Intel® Xeon® Gold 6248 pro srovnávací test kanálu BWA-GATK s řešeními Dell EMC Ready pro úložiště HPC Lustre (obnovení řady ME4) (2). Procesor Xeon® Gold 6248 obsahuje 20 fyzických jader nebo 40 logických jader při použití technologie Hyper Threading. Konfigurace testovacího clusteru jsou shrnuty v tabulce 1.
Dell EMC PowerEdge C6420 | |
---|---|
Procesor | 2x Xeon® Gold 6248, 20 jader, 2,5 GHz (Cascade Lake) |
RAM | 12 × 16 GB při 2 933 MTps |
Operační systém | Systém RHEL 7.6 |
Interconnect | Intel® Omni-Path |
Profil systému BIOS | Performance Optimized |
Logický procesor | Disabled |
Technologie virtualizace | Disabled |
BWA | 0.7.15-r1140 |
Nástroje Samtools | 1.6 |
GATK | 3,6-0-g89b7209 |
Řešení Dell EMC Ready pro úložiště Lustre | |
---|---|
Počet uzlů | 1x Dell EMC PowerEdge R640 jako integrated manager pro Lustre (IML) 2x Dell EMC PowerEdge R740 jako server metadat (MDS) 2x Dell EMC PowerEdge R740 jako object storage Server (OSS) |
Procesory | Server IML: Dva procesory Intel Xeon Gold 5118 s frekvencí 2,3 GHz pro servery MDS a OSS: Dva procesory Intel Xeon Gold 6136 s frekvencí 3,00 GHz |
Paměť | Server IML: 12 × 8 GB serverů DDR4 2 666 MT/s RDIMMs MDS a OSS: 24 x 16 GB paměti 2 666 MT/s DDR4 RDIMM |
Řadiče externího úložiště |
2 adaptéry Dell 12 Gb/s SAS HBA (na každém zařízení MDS) 4x Adaptéry Dell 12 Gb/s SAS HBA (na každém operačním systému) |
Skříně úložiště objektů |
4x ME4084 s celkem 336 × 8TB pevnými disky NL, 7 200 ot./min. SAS |
Skříň úložiště metadat |
1x ME4024 s 24 960GB disky SSD SAS Podporuje až 4,68 B inodes |
Řadiče RAID | Duplexní řadiče SAS RAID ve skříních ME4084 a ME4024 |
Operační systém | CentOS 7.5 x86_64 Red Hat Enterprise Linux (RHEL) 7.5 x86_64 |
Verze systému BIOS | 1.4.5 |
Verze Intel Omni-Path IFS |
10.8.0.0 |
Verze systému souborů Lustre |
2.10.4 |
Verze IML | 4.0.7.0 |