Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Rozwiązanie Dell EMC Ready dla nauk przyrodniczych HPC: Testy przepustowości potoku BWA-GATK z procesorem Cascade Lake i odświeżanym rozwiązaniem Lustre ME4

Summary: Rozwiązanie Dell EMC Ready dla nauk przyrodniczych HPC: Testy przepustowości potoku BWA-GATK z procesorem Cascade Lake i odświeżanym rozwiązaniem Lustre ME4

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Konfiguracja 64 węzłów obliczeniowych rozwiązań Dell EMC Ready Solutions dla nauk przyrodniczych HPC może przetwarzać 194 genomy dziennie (50x głębokość zasięgu).

Omówienie

Wywoływanie wariantówKliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies. to proces, w ramach którego identyfikujemy warianty z danych sekwencji. Proces ten pomaga ustalić, czy w pojedynczym genomie lub w wariantach strukturalnych (SPS) występują pojedyncze błędy (SCP), wstawienia i usunięcia (wycięcia) oraz warianty konstrukcyjne (SVs) w danym miejscu w pojedynczym genomie lub terkotanie. Głównym celem identyfikacji odmian genomicznych jest powiązanie z ludzkim nieprawidłowościem. Choć nie wszystkie cechy ludzkich są powiązane z różnicami w działaniu, warianty wywoływania mogą stanowić cenną wskazówkę dla wyścierniaków pracujących nad konkretną chorobą spowodowaną różnicami w działaniu. BWA-GATK jest jednym z narzędzi obliczeniowych sekwencjonowania nowej generacji (NGS), które są przeznaczone do identyfikacji zarazków i somatycznych błędów z danych NGS człowieka. Istnieje kilka narzędzi identyfikacji wariantów i rozumiemy, że nie ma jednego narzędzia, które działa doskonale (1). Wybieramy jednak GATK, który jest jednym z najpopularniejszych narzędzi jako nasze narzędzie do testów porównawczych, aby pokazać, jak rozwiązania Dell EMC Ready dla nauk przyrodniczych HPC mogą przetwarzać złożone i masowe obciążenia robocze NGS. 
Celem tego bloga jest dostarczenie cennych informacji o wydajności procesora Intel® Xeon® Gold 6248 dla potoku BWA-GATK z rozwiązaniami Dell EMC Ready Dla HPC Lustre Storage (odświeżenie serii ME4) (2). Procesor Xeon® Gold 6248 jest wyposażony w 20 rdzeni fizycznych lub 40 rdzeni logicznych podczas korzystania z wielowątkowości. Konfiguracje klastrów testowych podsumowano w tabeli 1.

Tabela 1 Przetestowana konfiguracja węzła obliczeniowego
 
Dell EMC PowerEdge C6420
Procesor 2x Xeon® Gold 6248, 20 rdzeni, 2,5 GHz (Cascade Lake)
RAM 12 x 16 GB przy prędkości 2933 MTps
System operacyjny RHEL 7.6
Połączenia Intel® Omni-Path
Profil systemu BIOS Zoptymalizowana wydajność
Procesor logiczny Disabled
Technologia wirtualizacji Disabled
BWA 0,7,15-r1140
Narzędzia Samtools 1.6
GATK 3,6-0-g89b7209

Przetestowane węzły obliczeniowe były podłączone do rozwiązań Dell EMC Ready dla pamięci masowej HPC Lustre za pośrednictwem Intel® Omni-Path. Konfiguracja podsumowania pamięci masowej znajduje się w tabeli 2.
Tabela 2 Dane techniczne sprzętu i oprogramowania
 
Rozwiązanie Dell EMC Ready dla pamięci masowej Lustre
Liczba węzłów 1x Dell EMC PowerEdge R640 jako integrated manager lustre (IML)
2x Dell EMC PowerEdge R740 jako serwer metadanych (MDS)
2x Dell EMC PowerEdge R740 jako serwer pamięci masowej obiektów (OSS)
Procesory Serwer IML: Dwa procesory Intel Xeon Gold 5118 z mds 2,3 GHz
i serwerami OSS: Dwa procesory Intel Xeon Gold 6136, 3,00 GHz
Pamięć Serwer IML: 12 serwerów MDS i OSS DDR4 RDIMM
8 GB 2666 MT/s: 24 moduły RDIMM DDR4 16 GB 2 666 MT/s
Zewnętrzne kontrolery pamięci masowej
2 karty HBA SAS 12 Gb/s firmy Dell (w każdym MDS)
4 karty HBA SAS 12 Gb/s firmy Dell (w każdym systemie operacyjnym)
Obudowy do przechowywania
obiektów
4 dyski twarde ME4084 z łącznie 336 dyskami twardymi SAS 336 x 8 TB NL 7,2 tys. obr./min
Obudowa pamięci masowej
metadanych
1 dysk ME4024 z 24 dyskami SSD SAS 960 GB. Obsługa do 4,68 B wędów
Kontrolery RAID Dwukierunkowe kontrolery SAS RAID w obudowach ME4084 i ME4024
System operacyjny CentOS 7.5 x86_64
Red Hat Enterprise Linux (RHEL) 7.5 x86_64
Wersja systemu BIOS 1.4.5
Wersja Intel Omni-Path
IFS
10.8.0.0
Wersja systemu
plików Lustre
2.10.4
Wersja IML 4.0.7.0

Dane testowe zostały wybrane z jednego z genomów Illumina Platinum. ERR194161 została przetworzona przy użyciu oprogramowania Illumina HiSeq 2000 przekazanego przez firmę Illumina i można ją pobrać z EMBL-EBI. Identyfikator DNA tej osoby jest NA12878. Opis danych z powiązanej witryny internetowej pokazuje, że ten przykład ma >30-ową głębokość zasięgu.

Ocena wydajności

Wydajność jednego przykładu wielu węzłów

Na rysunku 1 podsumowano czas wykonywania w różnych próbkach i węzłach obliczeniowych z 50x sekwencjonowania pełnego genomu (WGS). Testy wykonywane tutaj mają na celu wykazanie wydajności na poziomie serwera, a nie dla porównania poszczególnych komponentów. Punkty danych na rysunku 1 są obliczane na podstawie łącznej liczby próbek, jednej próby na węzeł obliczeniowy (oś X na rysunku), które są przetwarzane jednocześnie. Szczegółowe informacje o potoku BWA-GATK można uzyskać w witrynie internetowej Broad Institute (3). Maksymalna liczba węzłów obliczeniowych używanych w testach to 64x C6420s. C6420s z Lustre ME4 wykazuje lepsze działanie skalowania niż Lustre MD3.

  Porównanie wydajności lustre MD3 i Lustre ME4
Rysunek 1. Porównanie wydajności lustre MD3 i Lustre ME4

Wydajność wielu przykładowych węzłów

Typowym sposobem uruchomienia potoku NGS jest uruchomienie wielu próbek w węźle obliczeniowym i użycie wielu węzłów obliczeniowych w celu zmaksymalizowania przepustowości procesu danych NGS. Liczba węzłów obliczeniowych używanych w testach to 64 węzłów obliczeniowych C6420, a liczba próbek na węzeł wynosi pięć próbek. Nawet 320 próbek jest przetwarzanych jednocześnie w celu oszacowania maksymalnej liczby genomów dziennie bez niepowodzenia zadania.
Jak pokazano na rysunku 2, pojedynczy węzeł obliczeniowy C6420 może przetwarzać 3,24 z 50x genomów całego człowieka dziennie, gdy jednocześnie przetwarzanych jest 5 próbek. Dla każdego przykładu przydzielane jest 7 rdzeni i 30 GB pamięci. 

  Testy przepustowości z maks. 64 C6420 i Lustre ME4
Rysunek 2. Testy przepustowości z maks. 64 C6420 i Lustre ME4

320 z 50 genomów całego człowieka można przetwarzać przy użyciu 64 węzłów obliczeniowych C6420 w 40 godzin.  Innymi słowy, wydajność konfiguracji testowej podsumowuje 194 genomy dziennie dla całego genomu ludzkiego z 50-ową głębokością zasięgu.

Wnioski

Ponieważ rozmiar danych w ramach WGS stale rośnie. Bieżący średni rozmiar WGS to 50x. Jest to 5-krotnie większa wartość niż standardowo 4 lata temu, kiedy rozpoczynaliśmy test porównawczy potoku BWA-GATK. Coraz większe dane nie obciążają pojemności pamięci masowej, ponieważ większość aplikacji w potoku jest również powiązana z szybkością zegara procesora. W związku z tym przy rosnącym rozmiarze danych potok działa dłużej, zamiast generować więcej zapisów.
Jednak w trakcie procesu generowana jest większa liczba plików tymczasowych ze względu na konieczność równoległości większej ilości danych, a ta zwiększona liczba otwartych plików tymczasowych w tym samym czasie wyczerpuje otwarty limit plików w systemie operacyjnym Linux. Jedna z aplikacji w trybie cichym nie została ukończona przez osiągnięcie limitu liczby otwartych plików. Prostym rozwiązaniem jest zwiększenie limitu do >150 tys. obr./min. 
Mimo to rozwiązanie Ready Solution z Lustre ME4 jako przestrzenią do zarysowania ma lepszą przepustowość niż w poprzedniej wersji. Rozwiązanie Ready Solution dla 64 węzłów zapewnia moc przetwarzania 194 genomów dziennie dla 50x WGS.

Resources 

1. Ankieta narzędzi do analizy wariantów danych sekwencjonowania genomu nowej generacji. Pabilla S, Dander A,Hibilla M, Snajder R, Sperk M, Emc M, Nabyty B, Speicher MR, Zschocke J, Trajanoski Z. 2, s.l. : Krótki opis systemu BIOINFORM, 2014 marca, wew. 15 (2). 10.1093/bib/bbs086.
2. Rozwiązanie Dell EMC Ready dla pamięci masowej HPC Lustre.  (Artykuł nie jest już dostępny do użytku referencyjnego, pobierany przez zespół HPC)
3. Zestaw narzędzi do analizy genomu. https://software.broadinstitute.org/gatk/ Kliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies.

Article Properties


Affected Product

ME Series, Dell EMC Ready Solution Resources, PowerEdge C6420, Dell EMC PowerVault ME4024, Dell EMC PowerVault ME4084, Red Hat Enterprise Linux Version 7

Last Published Date

11 Jan 2024

Version

6

Article Type

Solution