Falcon-kiihdytetty genomiikkaväylä, jossa on yksi Intelin FPGA-ohjelmoitava kiihdytyskortti, pystyy käsittelemään 50 kertaa kokonaisia ihmisen genomeja alle 3 tunnissa alternative variant calling pipeline -toiminnolla.
Yleiskatsaus, markkinahaaste (tarve), Falcon-ratkaisu vastaa tarpeeseesi
Täsmälääkinnät, genomiikat ja genoneetit käyttävät genomi-sekvensointia tutkimusten suorittamiseen, diagnosoinnin parantamiseen, lääkealan kehittämiseen, terveydenhuollon tarjoajien koulutuksen laadun parantamiseen ja kasvun optimointiin. Biotieteissä genomianalyysi on nyt keskeinen sovellus, koska tiedonkeruukustannukset pienenevät merkittävästi seuraavan sukupolven sekvensoinnin (NGS) edistymisen jälkeen. Tietokokoelman lisääntymisen lisäksi yliopistoissa, genomitutkimuskeskuksissa, lääkeyrityksissä ja terveydenhuollon organisaatioissa käytettävien genomisovellusten valikoima on kasvanut merkittävästi.
Genomitietojen määrä tuplaantuu seitsemän kuukauden välein (1). Siksi tietojen käsittely tehokkaalla ja kustannustehokkaalla tavalla on muuttunut kriittiseksi. Vain suoritinratkaisujen laskentateho ei skaalautuu genomitietojen kasvun mukana. Tämä on aiheuttanut laitteistokiihdytyksen tarpeen. Kiihdyttimet, kuten FPBA:t, ovat muuttumassa kiertoa vastaamaan tämän genomitietojen räjähdyksen laskentatarpeisiin. FaGP (Falcon Accelerated Genomics Pipeline) on joustava, suuri siirtonopeus ja pienempi näytekohtainen hinta verrattuna muihin laitteistokiihdyttämiin ratkaisuihin.
Mikä on FPGA, Intel PAC offering & Advantage
FPBA-laitteet ovat dynaaminen uudelleenohjelmoitavia laitteista, joiden tietopolku vastaa työkuormia täsmälleen, kuten genomien sekvensointi, tietojen analytiikka tai pakkaus, kuten kuvassa 1 on kuvattu. Monipuolisuus mahdollistaa nopeamman käsittelyn, tehokkaamman laskentatehon ja pienemmän viivepalvelun – kokonaiskäyttökustannusten pienentämisen ja laskentakapasiteetin maksimoinnin konesalien virran, tilan ja jäähdytysrajoitusten puitteissa.
FPBA:t edellyttävät perinteisesti syvällistä toimialueosaamista ohjelmoinnissa. Intel tarjoaa kiihdytysalustan, joka yksinkertaistaa kehityskulkua ja mahdollistaa nopean käyttöönoton konesalissa. Se sisältää PCI Express* (PCIe*) -pohjaiset Intel FPGA -ohjelmoitavat kiihdytyskortit (Intel FPGA PAC) ja Intel® Acceleration Stack for Intel Xeon® -suorittimen ja FPGA-kortit. Nämä Intel-ympäristöt tukevat, validoidaan ja otetaan käyttöön Dell EMC:n kautta. Yhdessä Falcon Computingin kaltaisten ekosysteemikumppaneiden kanssa Intel Acceleration Platform on luotettava ja käyttövalmis ratkaisu, jossa on läpinäkyvät laitteistot konepeitteen alla.
Kuva 1: GATK-vakiokanavan parempi tarkkuus ja nopeus
Falcon-ratkaisun tiedot:
Genomianalyysityökalut (GATK) on genomitietojen käsittelyn kultastandardi, jonka genomiyhteisö hyväksyy (2). Sen parhaiden käytäntöjen työnkulku (BPW) on tunnettu tietojenkäsittelyn hitaudesta, joka tuottaa tuloksia suurista näytteistä, kuten koko genomista (WGS). Falcon Computing Solutions on kehittänyt joustavan ohjelmistopaketin, joka seuraa BPW-tekniikkaa ja jonka voi ottaa käyttöön helposti useissa ympäristöissä ja arkkitehtuureissa. Se on nopea usealla eri tilausmäärällä verrattuna suoritinpohjaisiin GATK-myyntiin.
FAGP on kattava ratkaisu, joka analysoi genomitietoja kustannustehokkaasti GATK-väylän avulla sekä tarjoaa erinomaisen suorituskyvyn, tarkkuuden ja toistettavissa olevan ratkaisun. Ratkaisun nopeus on jopa 15 kertaa nopeampi ja täsmällinen kuin GATK:n (3). Tämä tarkoittaa, että analyysi, joka kestää yleensä 50–60 tuntia, voidaan suorittaa alle 4 tunnissa (3). FAGP tarjoaa erinomaista kiihdytystä ja tarkkuutta suorituskykyisten, luotettavien Intel Arria 10 FPGA -suorittimien ja Intel® Xeon® -suorittimien kanssa.
FAGP noudattaa GATK BPW -parametria. Se kiihdyttää monissa pipeline-toimintojen osissa kohdistuksesta (BWA) versiopuheluihin (HaplotypeCaller) (4). Nopeutetun BWA:n lisäksi se sisältää myös kiihdytetun version aligner Minimap2 -toiminnosta, joka on osa Falconin vaihtoehtoista genomikanavaa (5). Vaihtoehtoinen pipeline tarjoaa entistä nopeamman ratkaisun. Se voi suorittaa 50 kertaa koko genomin sekvensoinnin 3 tunnin kuluessa. Molemmissa kohdistuksissa on toiminto, joka tuottaa merkittyjä kaksoiskappaleita ja lajiteltuja lukuja ilman lisätyökaluja.
FAGP parantaa suorituskykyä ja siirtonopeutta nopeuttamalla gatk-toimintojen vaativaa laskentaa Intelin FPGA PAC -alustojen avulla. Tämä eroaa skaalautuvien ratkaisujen suoritustehon saavuttamisesta lisäämällä suorittimen resursseja. Tällaiset skaalautuvat ratkaisut voivat vähentää kustannuksia tai esimerkkikohtaisia viivettä.
Falcon-ratkaisun toinen etu on, että kyseessä on avoin myynti GATK-ratkaisuna. Käyttäjät voivat hallita eri vaiheita pipeline-toiminnoissa. Välitiedot tallennetaan ja niitä voi käyttää.
Taulukko 1 Falcon-kiihdytettyjen genomiikan putken edut
FaGP (Falcon Accelerated Genomics Pipeline) -edut |
True GATK |
Useiden GATK-versioiden tuki, mukaan lukien 4.0 |
Toimialan skaalaus |
Suorita viisi koko genomia tai 24 kokonaista exomea yhdessä päivässä |
Vaihtoehtoinen versio |
< WGS:n 3 tunnin toimitusaika prem-prem-määrityksessä (50 x) |
Nopeus |
GATK-käytäntöjen siirto jopa >15 kertaa nopeammin |
Hyödynnä olemassa olevia |
Ei tarvitse kirjoittaa uudelleen toimivia algoritmeja |
Dellin laitteistokokoonpano
Taulukko 2: Dell EMC PowerEdge R740xd testisänkynänä
Dell EMC PowerEdge R740xd |
Suoritin |
2 x Intel(R) Xeon(R) Gold 6148 -suoritin @ 2,4 GHz |
Muisti |
384 Gt , 32 x 16 Gt:n RDIMM, 2 666 MT/s, Dual Rank |
Tallennustila |
4 x 1,2 Tt:n SAS 10 000 kierr./min, 12 Gbps 512n 2,5 tuuman käytön aikana vaihdettava kiintolevy RAID 0 2x INTEL SSDPEDMD020T4 DC P3700 1.8T ohjelmisto-RAID 0:ssa |
FPGA |
IntelIn ohjelmoitava kiihdytyskortti, jossa Intel Arria® 10 GX FPGA (Intel Acceleration Stack 1.1) |
Järjestelmän profiili |
Suorituskyky |
BIOS-versio |
2.1.3 |
Hypersäikeistys |
Käytössä |
Käyttöjärjestelmä |
Red Hat Enterprise Linux Server release 7.4 (Maipo) (3.10.0-693.el7.x86_64) |
Suorituskyvyn arviointi
Testitestauksessa käytimme ihmisen koko perimän sekvensointia 10 x, 30 ja 50 kertaa syvyyteen.
Taulukko 3 Testatut koko genomin sekvensointitiedot
Tulokset:
Taulukossa 4 on yhteenveto ajasta, joka kului GATK 4.0 Best Practices Pipeline -toiminnossa kolmen testisyklin aikana FAGP:n ja DELL EMC PowerEdge R740xd -palvelimen Intelin FPGA PAC -toiminnolla.
Taulukko 4 Parhaiden käytäntöjen Pipeline-version 2.1.1 käyttöajat yhteensä
Näyte |
Kattavuussyvyys |
Testi 1 |
Kesto (min) Testi 2 |
Testi 3 |
ERR091571 |
10 x |
75.63 |
76.67 |
76.38 |
SRR3124837 |
30 x |
160.00 |
162.77 |
161.38 |
ERR194161 |
50 x |
242.97 |
250.65 |
247.18 |
Taulukossa 5 on yhteenveto ajasta (minuutteina), joka kuluu vaihtoehtoisen pipeline-ratkaisun suorittamiseen: Falcon Cremline kolmen testijakson aikana FAGP:n ja DELL EMC PowerEdge R740xd -palvelimeen tallennetun Intelin FPGA PAC -ohjaimen avulla.
Taulukko 5 Vaihtoehtoisten versioiden myyntikertoja yhteensä
Näyte |
Kattavuussyvyys |
Testi 1 |
Kesto (min) Testi 2 |
Testi 3 |
ERR091571 |
10 x |
62.70 |
58.21 |
59.80 |
SRR3124837 |
30 x |
130.38 |
129.90 |
129.95 |
ERR194161 |
50 x |
171.52 |
171.87 |
171.37 |
Falcon-genomiratkaisun yhteenveto
Falcon Accelerated Genomics Pipeline tarjoaa suuren siirtonopeuden, edulliset/esimerkki-/päiväedut. FAGP on täydellinen ratkaisu, jonka voi ottaa käyttöön helposti genomien sekvensointisovelluksissa yhdessä Intel FPGA Programmable Acceleration Cardin ja sertifioidun DELL-palvelimen kanssa.
" Tarjoamme TCGB:llä genomin sekvensointipalveluja virtuaaliasiakkaillemme. Falcon-kiihdytetty genomiikkamyynti* on mahdollistanut sen, että toimitusaikamme on katkaistu muutamasta tunnista ja alan standardinmukaisten GATK-myyntien tarkkuus pysyy edelleen hyvänä."
— Genomiikan ja bioinformatiikan (TCGB) TEKNOLOGIAKESKUKSEN johtaja Xinmin Li
Resursseja
1. Perimän sekvensointi luo niin paljon tietoja, että emme tiedä, mitä tehdä sille. [Online] https://www.washingtonpost.com/news/speaking-of-science/wp/2015/07/07/sequencing-the-genome-creates-so-much-data-we-don-t-know-what-to-do-with-it.
2. GATK-JÄNNITYS [Online]
https://software.broadinstitute.org/gatk/3. Kiihdytetty genomiikka. [Online]
http://www.falconcomputing.com/falcon-accelerated-genomics-pipeline4. BWA. [Online]
http://bio-bwa.sourceforge.net/bwa.shtml5. Minimap2. [Online]
https://github.com/lh3/minimap2
Genomien sekvensoinnin tehostaminen FAGP (Falcon Accelerated Genomics Pipeline) -toiminnolla Intel FPGA PAC:ssa
Falcon-kiihdytetty genomiikkaväylä, jossa on yksi Intelin FPGA-ohjelmoitava kiihdytyskortti, pystyy käsittelemään 50 kertaa kokonaisia ihmisen genomeja alle 3 tunnissa alternative variant calling pipeline -toiminnolla.