64-compute node-konfigurationen af Dell EMC Ready Solutions til HPC Life Sciences kan behandle 194 genomer om dagen (50 gange mere dybde).
Oversigt
Variant-opkald er en proces, hvor vi identificerer varianter fra sekvensdata. Denne proces hjælper med at afgøre, om der er enkelt nucleotide-polymorphismer (SNP'er), indsættelser og sletninger (indels) og eller strukturelle varianter (SV'er) i en given position i et individuelt genom eller kvitter. Det primære mål med at identificere genomiske variationer er knyttet til menneskeligt kendskab. Selvom ikke alle menneskeligt personale er forbundet med variantvariationer, kan variantopkald give en værdifuld retningslinje for arbejdspladsmedarbejdere, der arbejder på en bestemt virus forårsaget af genstartsvariationer. BWA-GATK er et af beregningsværktøjerne for næste generation af NGS (Sequencing), der er designet til at identificere afhjælpningsskærme og somatiske enheder fra menneskelige NGS-data. Der findes en del variantidentifikationsværktøjer, og vi forstår, at der ikke er et enkelt værktøj, der fungerer perfekt (1). Vi valgte imidlertid GATK, som er et af de mest populære værktøjer som vores benchmarking-værktøj til at demonstrere, hvor godt Dell EMC Ready Solutions til HPC Life Sciences kan håndtere komplekse og massive NGS-workloads.
Formålet med denne blog er at give værdifulde oplysninger om intel® Xeon® Gold 6248-processoren til BWA-GATK pipeline-benchmark med Dell EMC Ready Solutions til HPC Lustre Storage (ME4-seriens opdatering) (2). Xeon® Gold 6248 CPU'en har 20 fysiske kerner eller 40 logiske kerner, når du bruger hypertrådning. Testklyngekonfigurationerne er opsummeret i Tabel 1.
Dell EMC PowerEdge C6420 | |
---|---|
CPU | 2x Xeon® Gold 6248 20 kerner 2,5 GHz (Cascade Lake) |
RAM | 12 x 16 GB ved 2933 MTps |
OPERATIVSYSTEM | RHEL 7.6 |
Interconnect | Intel® Omni-Path |
BIOS-systemprofil | Ydeevneoptimeret |
Logisk processor | Disabled |
Virtualiseringsteknologi | Disabled |
BWA | 0.7.15-r1140 |
Samtools | 1.6 |
GATK | 3,6-0-g89b7209 |
Dell EMC Ready Solution til Lustre-lagring | |
---|---|
Antal noder | 1x Dell EMC PowerEdge R640 som Integrated Manager for Lustre (IML) 2x Dell EMC PowerEdge R740 som metadataserver (MDS) 2x Dell EMC PowerEdge R740 som Object Storage Server (OSS) |
Processorer | IML-server: Dual Intel Xeon Gold 5118 ved 2,3 GHz MDS- og OSS-servere: Dual Intel Xeon Gold 6136 ved 3,00 GHz |
Hukommelse | IML-server: 12 x 8 GB 2.666 MT/s DDR4 RDIMM-moduler MDS- og OSS-servere: 24 x 16 GiB 2.666 MT/s DDR4 RDIMM'er |
Eksterne storagecontrollere |
2 x Dell 12 GB/s SAS HBA'er (på hver MDS) 4 x Dell 12 GB/s SAS HBA'er (på hver OSS) |
Objektlagringskabinetter |
4 x ME4084 med i alt 336 x 8 TB NL SAS-harddiske (7.200 omdr./min.) |
Opbevaringskabinet for metadata |
1 x ME4024 med 24 x 960 GB SAS SSD'er. Understøtter op til 4,68 B inodes |
RAID-controllere | Dupleks SAS RAID-controllere i KABINETter for ME4084 og ME4024 |
Operativsystem | CentOS 7.5 x86_64 Red Hat Enterprise Linux (RHEL) 7.5-x86_64 |
BIOS-version | 1.4.5 |
Intel Omni-Path IFS-version |
10.8.0.0 |
Luster-filsystemversion |
2.10.4 |
IML-version | 4.0.7.0 |