Konfigurasjon av 64-datanode for Dell EMC Ready Solutions for HPC Life Sciences kan behandle 194 genom per dag (50x dekningsdybde).
Oversikt
Variantanrop er en prosess der vi identifiserer varianter fra sekvensdata. Denne prosessen hjelper deg med å fastslå om det finnes enkelt nukleotidpolymorfismer (SNP-er), innsettinger og slettinger (indels) og eller strukturelle varianter (SVs) på en gitt posisjon i et individuelt genom eller en underordner. Det viktigste målet med å identifisere genomiske variasjoner er å knytte seg til humane sammenhenger. Selv om ikke alle menneskelige utsparinger er knyttet til varianter, kan variantsamtaler gi en verdifull retningslinje for å jobbe med en bestemt oppsparing forårsaket av oppsparende variasjoner. BWA-GATK er et av de neste generasjons sekvenseringsverktøy (NGS) som er utformet for å identifisere utrykningsmidler og somatiske NGS-data fra humane NGS-data. Det finnes en oppspørring av variantidentifikasjonsverktøy, og vi forstår at det ikke finnes ett enkelt verktøy som fungerer perfekt (1). Vi valgte imidlertid GATK, som er et av de mest populære verktøyene som benchmarking-verktøyet vårt, for å demonstrere hvor godt Dell EMC Ready Solutions for HPC Life Sciences kan behandle komplekse og massive NGS-workloader.
Formålet med denne bloggen er å gi verdifull ytelsesinformasjon om Intel® Xeon® Gold 6248-prosessoren for BWA-GATK pipeline benchmark med Dell EMC Ready Solutions for HPC Lustre Storage (oppdatering i ME4-serien) (2). Xeon® Gold 6248 CPU har 20 fysiske kjerner eller 40 logiske kjerner når du bruker hyper threading. Konfigurasjonene av testklyngen er oppsummert i tabell 1.
Dell EMC PowerEdge C6420 | |
---|---|
CPU | 2 x Xeon® Gold 6248 20 kjerner, 2,5 GHz (Cascade Lake) |
RAM | 12 x 16 GB ved 2933 MTps |
OS | RHEL 7.6 |
Interconnect | Intel® Omni-bane |
BIOS-systemprofil | Optimert ytelse |
Logisk prosessor | Deaktivert |
Virtualiserings-teknologi | Deaktivert |
BWA | 0.7.15-r1140 |
Samtools | 1.6 |
GATK | 3,6-0 g89b7209 |
Dell EMC Ready Solution for Lustre Storage | |
---|---|
Antall noder | 1 x Dell EMC PowerEdge R640 som Integrated Manager for Lustre (IML) 2 x Dell EMC PowerEdge R740 som Metadata Server (MDS) 2x Dell EMC PowerEdge R740 som Object Storage Server (OSS) |
Prosessorer | IML-server: Dual Intel Xeon Gold 5118 ved 2,3 GHz MDS- og OSS-servere: Dual Intel Xeon Gold 6136 ved 3,00 GHz |
Minne | IML-server: 12 x 8 GB 2666 MT/s DDR4 RDIMM MDS - og OSS-servere: 24 x 16 GiB 2666 MT/s DDR4 RDIMM-er |
Eksterne lagringskontrollere |
2 x Dell 12 Gb/s SAS HBA-er (på hver MDS) 4 x Dell 12 Gb/s SAS HBA-er (på hver OSS) |
Objektlagringskabinetter |
4 x ME4084 med totalt 336 x 8 TB NL HDD-er med 7,2 000 o/min |
Kabinett for metadatalagring |
1 x ME4024 med 24 x 960 GB SAS SSD-disker. Støtter opptil 4,68 B-inoder |
RAID-kontrollere | Dupleks SAS RAID-kontrollere i ME4084- og ME4024-kabinetter |
Operativsystem | CentOS 7.5 x86_64 Red Hat Enterprise Linux (RHEL) 7,5 x86_64 |
BIOS-versjon | 1.4.5 |
Intel Omni-Path IFS-versjon |
10.8.0.0 |
Lustre filsystemversjon |
2.10.4 |
IML-versjon | 4.0.7.0 |