Konfiguration av 64-beräkningsnoder för Dell EMC-färdiga lösningar för HPC-biovetenskap kan bearbeta 194 genom per dag (50x täckningsdjup).
Översikt
Variantsamtal är en process genom vilken vi identifierar varianter från sekvensdata. Den här processen hjälper till att avgöra om det finns enstaka nucleotide-polymormorismer (SNPs), insertions och deletions (indels) och eller strukturella varianter (SVS) på en viss position i ett individuellt genom eller matrisom. Det huvudsakliga målet med att identifiera genomiska variationer är att koppla till mänsklig identitet. Även om inte alla mänskliga orsaker är associerade med olika varianter kan anrop av varianter ge en värdefull vägledning för stötar som arbetar med en viss sjukdom som orsakas av variationer från någon av dem. BWA-GATK är ett av nästa generations sekvenseringsverktyg (NGS) som är utformade för att identifiera germline- och somatic-dukationer från mänskliga NGS-data. Det finns en mängd olika identifieringsverktyg, och vi förstår att det inte finns ett enda verktyg som fungerar perfekt (1). Vi valde dock GATK som är ett av de mest populära verktygen som vårt bedömningsverktyg för att visa hur väl Dell EMC Ready Solutions för HPC-biovetenskap kan bearbeta komplexa och enorma NGS-arbetsbelastningar.
Syftet med den här bloggen är att ge värdefull prestandainformation om Intel® Xeon® Gold 6248-processorn för prestandatest av BWA-GATK-pipelinen med Dell EMC Ready-lösningar för HPC Lustre-lagring (ME4-seriens uppdatering) (2). Xeon® Gold 6248-processorn har 20 fysiska kärnor eller 40 logiska kärnor när du använder hypertrådning. Testklusterkonfigurationerna sammanfattas i tabell 1.
Dell EMC PowerEdge C6420 | |
---|---|
Processor | 2x Xeon® Gold 6248 20 kärnor 2,5 GHz (Cascade Lake) |
RAM | 12x 16 GB vid 2 933 MTps |
OS | RHEL 7.6 |
Interconnect | Intel® Omni-Path |
BIOS-systemprofil | Prestandaoptimerad |
Logisk processor | Disabled (avaktiverad) |
Virtualiseringsteknik | Disabled (avaktiverad) |
BWA | 0.7.15-r1140 |
Samtools | 1.6 |
GATK | 3,6-0-g89b7209 |
Dell EMC-färdig lösning för Lustre-lagring | |
---|---|
Antal noder | 1x Dell EMC PowerEdge R640 som Integrated Manager for Lustre (IML) 2x Dell EMC PowerEdge R740 som Metadata Server (MDS) 2x Dell EMC PowerEdge R740 som objektlagringsserver (OSS) |
Processorer | IML-server: Dubbla Intel Xeon Gold 5118 vid 2,3 GHz MDS- och OSS-servrar: Dubbel Intel Xeon Gold 6136 vid 3,00 GHz |
Minne | IML-server: 12 x 8 GB 2 666 MT/s DDR4 RDIMM MDS- och OSS-servrar: 24 x 16 GiB 2 666 MT/s DDR4 RDIMM-moduler |
Externa lagringsstyrenheter |
2 Dell SAS HBA:er på 12 Gbit/s (på varje MDS) 4 × Dell 12 Gbit/s SAS HBA:er (på varje OSS) |
Objektlagringshöljen |
4 × ME4084 med totalt 336 × 8 TB NL 7 200 varv/min SAS-hårddiskar |
Metadatalagringshölje |
1 × ME4024 med 24 × 960 GB SAS SSD-diskar. Stöder upp till 4,68 B inoder |
RAID-styrenheter | Duplex SAS RAID-styrenheter i ME4084- och ME4024-höljen |
Operativsystem | CentOS 7.5 x86_64 Red Hat Enterprise Linux (RHEL) 7.5 x86_64 |
BIOS-version | 1.4.5 |
Intel OMNI-Path IFS-version |
10.8.0.0 |
Lustre filsystemversion |
2.10.4 |
IML-version | 4.0.7.0 |