跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表

Genomien sekvensoinnin tehostaminen FAGP (Falcon Accelerated Genomics Pipeline) -toiminnolla Intel FPGA PAC:ssa

摘要: Falcon-kiihdytetty genomiikkaväylä, jossa on yksi Intelin FPGA-ohjelmoitava kiihdytyskortti, pystyy käsittelemään 50 kertaa kokonaisia ihmisen genomeja alle 3 tunnissa alternative variant calling pipeline -toiminnolla. ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Falcon-kiihdytetty genomiikkaväylä, jossa on yksi Intelin FPGA-ohjelmoitava kiihdytyskortti, pystyy käsittelemään 50 kertaa kokonaisia ihmisen genomeja alle 3 tunnissa alternative variant calling pipeline -toiminnolla. 

 



Yleiskatsaus, markkinahaaste (tarve), Falcon-ratkaisu vastaa tarpeeseesi

Täsmälääkinnät, genomiikat ja genoneetit käyttävät genomi-sekvensointia tutkimusten suorittamiseen, diagnosoinnin parantamiseen, lääkealan kehittämiseen, terveydenhuollon tarjoajien koulutuksen laadun parantamiseen ja kasvun optimointiin. Biotieteissä genomianalyysi on nyt keskeinen sovellus, koska tiedonkeruukustannukset pienenevät merkittävästi seuraavan sukupolven sekvensoinnin (NGS) edistymisen jälkeen. Tietokokoelman lisääntymisen lisäksi yliopistoissa, genomitutkimuskeskuksissa, lääkeyrityksissä ja terveydenhuollon organisaatioissa käytettävien genomisovellusten valikoima on kasvanut merkittävästi. 
Genomitietojen määrä tuplaantuu seitsemän kuukauden välein (1). Siksi tietojen käsittely tehokkaalla ja kustannustehokkaalla tavalla on muuttunut kriittiseksi. Vain suoritinratkaisujen laskentateho ei skaalautuu genomitietojen kasvun mukana. Tämä on aiheuttanut laitteistokiihdytyksen tarpeen. Kiihdyttimet, kuten FPBA:t, ovat muuttumassa kiertoa vastaamaan tämän genomitietojen räjähdyksen laskentatarpeisiin. FaGP (Falcon Accelerated Genomics Pipeline) on joustava, suuri siirtonopeus ja pienempi näytekohtainen hinta verrattuna muihin laitteistokiihdyttämiin ratkaisuihin.
 



Mikä on FPGA, Intel PAC offering & Advantage

FPBA-laitteet ovat dynaaminen uudelleenohjelmoitavia laitteista, joiden tietopolku vastaa työkuormia täsmälleen, kuten genomien sekvensointi, tietojen analytiikka tai pakkaus, kuten kuvassa 1 on kuvattu. Monipuolisuus mahdollistaa nopeamman käsittelyn, tehokkaamman laskentatehon ja pienemmän viivepalvelun – kokonaiskäyttökustannusten pienentämisen ja laskentakapasiteetin maksimoinnin konesalien virran, tilan ja jäähdytysrajoitusten puitteissa. 
FPBA:t edellyttävät perinteisesti syvällistä toimialueosaamista ohjelmoinnissa. Intel tarjoaa kiihdytysalustan, joka yksinkertaistaa kehityskulkua ja mahdollistaa nopean käyttöönoton konesalissa. Se sisältää PCI Express* (PCIe*) -pohjaiset Intel FPGA -ohjelmoitavat kiihdytyskortit (Intel FPGA PAC) ja Intel® Acceleration Stack for Intel Xeon® -suorittimen ja FPGA-kortit. Nämä Intel-ympäristöt tukevat, validoidaan ja otetaan käyttöön Dell EMC:n kautta. Yhdessä Falcon Computingin kaltaisten ekosysteemikumppaneiden kanssa Intel Acceleration Platform on luotettava ja käyttövalmis ratkaisu, jossa on läpinäkyvät laitteistot konepeitteen alla.



SLN319291_en_US__1image (12669)
Kuva 1: GATK-vakiokanavan parempi tarkkuus ja nopeus
 



Falcon-ratkaisun tiedot:

Genomianalyysityökalut (GATK) on genomitietojen käsittelyn kultastandardi, jonka genomiyhteisö hyväksyy (2). Sen parhaiden käytäntöjen työnkulku (BPW) on tunnettu tietojenkäsittelyn hitaudesta, joka tuottaa tuloksia suurista näytteistä, kuten koko genomista (WGS). Falcon Computing Solutions on kehittänyt joustavan ohjelmistopaketin, joka seuraa BPW-tekniikkaa ja jonka voi ottaa käyttöön helposti useissa ympäristöissä ja arkkitehtuureissa.  Se on nopea usealla eri tilausmäärällä verrattuna suoritinpohjaisiin GATK-myyntiin.
FAGP on kattava ratkaisu, joka analysoi genomitietoja kustannustehokkaasti GATK-väylän avulla sekä tarjoaa erinomaisen suorituskyvyn, tarkkuuden ja toistettavissa olevan ratkaisun. Ratkaisun nopeus on jopa 15 kertaa nopeampi ja täsmällinen kuin GATK:n (3). Tämä tarkoittaa, että analyysi, joka kestää yleensä 50–60 tuntia, voidaan suorittaa alle 4 tunnissa (3). FAGP tarjoaa erinomaista kiihdytystä ja tarkkuutta suorituskykyisten, luotettavien Intel Arria 10 FPGA -suorittimien ja Intel® Xeon® -suorittimien kanssa. 
FAGP noudattaa GATK BPW -parametria. Se kiihdyttää monissa pipeline-toimintojen osissa kohdistuksesta (BWA) versiopuheluihin (HaplotypeCaller) (4). Nopeutetun BWA:n lisäksi se sisältää myös kiihdytetun version aligner Minimap2 -toiminnosta, joka on osa Falconin vaihtoehtoista genomikanavaa (5).  Vaihtoehtoinen pipeline tarjoaa entistä nopeamman ratkaisun. Se voi suorittaa 50 kertaa koko genomin sekvensoinnin 3 tunnin kuluessa. Molemmissa kohdistuksissa on toiminto, joka tuottaa merkittyjä kaksoiskappaleita ja lajiteltuja lukuja ilman lisätyökaluja. 
FAGP parantaa suorituskykyä ja siirtonopeutta nopeuttamalla gatk-toimintojen vaativaa laskentaa Intelin FPGA PAC -alustojen avulla. Tämä eroaa skaalautuvien ratkaisujen suoritustehon saavuttamisesta lisäämällä suorittimen resursseja. Tällaiset skaalautuvat ratkaisut voivat vähentää kustannuksia tai esimerkkikohtaisia viivettä.
Falcon-ratkaisun toinen etu on, että kyseessä on avoin myynti GATK-ratkaisuna. Käyttäjät voivat hallita eri vaiheita pipeline-toiminnoissa. Välitiedot tallennetaan ja niitä voi käyttää.


Taulukko 1 Falcon-kiihdytettyjen genomiikan putken edut

 
FaGP (Falcon Accelerated Genomics Pipeline) -edut
True GATK Useiden GATK-versioiden tuki, mukaan lukien 4.0
Toimialan skaalaus Suorita viisi koko genomia tai 24 kokonaista exomea yhdessä päivässä
Vaihtoehtoinen versio < WGS:n 3 tunnin toimitusaika prem-prem-määrityksessä (50 x)
Nopeus GATK-käytäntöjen siirto jopa >15 kertaa nopeammin
Hyödynnä olemassa olevia Ei tarvitse kirjoittaa uudelleen toimivia algoritmeja
 



Dellin laitteistokokoonpano

Taulukko 2: Dell EMC PowerEdge R740xd testisänkynänä

Dell EMC PowerEdge R740xd
Suoritin 2 x Intel(R) Xeon(R) Gold 6148 -suoritin @ 2,4 GHz
Muisti 384 Gt , 32 x 16 Gt:n RDIMM, 2 666 MT/s, Dual Rank
Tallennustila 4 x 1,2 Tt:n SAS 10 000 kierr./min, 12 Gbps 512n 2,5 tuuman käytön aikana vaihdettava kiintolevy RAID 0 2x INTEL SSDPEDMD020T4 DC P3700 1.8T ohjelmisto-RAID 0:ssa
FPGA IntelIn ohjelmoitava kiihdytyskortti, jossa Intel Arria® 10 GX FPGA (Intel Acceleration Stack 1.1)
Järjestelmän profiili Suorituskyky
BIOS-versio 2.1.3
Hypersäikeistys Käytössä
Käyttöjärjestelmä Red Hat Enterprise Linux Server release 7.4 (Maipo) (3.10.0-693.el7.x86_64)



Suorituskyvyn arviointi

Testitestauksessa käytimme ihmisen koko perimän sekvensointia 10 x, 30 ja 50 kertaa syvyyteen.


Taulukko 3 Testatut koko genomin sekvensointitiedot

 
Suorita siunaaminen Kattavuussyvyys Tietolinkki
ERR091571 10 x https://www.ebi.ac.uk/ena/data/view/ERR091571
SRR3124837 30 x https://www.ebi.ac.uk/ena/data/view/SRR3124837
ERR194161 50 x https://www.ebi.ac.uk/ena/data/view/ERR194161


 

Tulokset:

Taulukossa 4 on yhteenveto ajasta, joka kului GATK 4.0 Best Practices Pipeline -toiminnossa kolmen testisyklin aikana FAGP:n ja DELL EMC PowerEdge R740xd -palvelimen Intelin FPGA PAC -toiminnolla.


Taulukko 4 Parhaiden käytäntöjen Pipeline-version 2.1.1 käyttöajat yhteensä
Näyte Kattavuussyvyys Testi 1 Kesto (min)
Testi 2
Testi 3
ERR091571 10 x 75.63 76.67 76.38
SRR3124837 30 x 160.00 162.77 161.38
ERR194161 50 x 242.97 250.65 247.18

Taulukossa 5 on yhteenveto ajasta (minuutteina), joka kuluu vaihtoehtoisen pipeline-ratkaisun suorittamiseen: Falcon Cremline kolmen testijakson aikana FAGP:n ja DELL EMC PowerEdge R740xd -palvelimeen tallennetun Intelin FPGA PAC -ohjaimen avulla.


Taulukko 5 Vaihtoehtoisten versioiden myyntikertoja yhteensä
Näyte Kattavuussyvyys Testi 1 Kesto (min)
Testi 2
Testi 3
ERR091571 10 x 62.70 58.21 59.80
SRR3124837 30 x 130.38 129.90 129.95
ERR194161 50 x 171.52 171.87 171.37
 



Falcon-genomiratkaisun yhteenveto

Falcon Accelerated Genomics Pipeline tarjoaa suuren siirtonopeuden, edulliset/esimerkki-/päiväedut. FAGP on täydellinen ratkaisu, jonka voi ottaa käyttöön helposti genomien sekvensointisovelluksissa yhdessä Intel FPGA Programmable Acceleration Cardin ja sertifioidun DELL-palvelimen kanssa.
" Tarjoamme TCGB:llä genomin sekvensointipalveluja virtuaaliasiakkaillemme. Falcon-kiihdytetty genomiikkamyynti* on mahdollistanut sen, että toimitusaikamme on katkaistu muutamasta tunnista ja alan standardinmukaisten GATK-myyntien tarkkuus pysyy edelleen hyvänä."
— Genomiikan ja bioinformatiikan (TCGB) TEKNOLOGIAKESKUKSEN johtaja Xinmin Li



Resursseja 

1. Perimän sekvensointi luo niin paljon tietoja, että emme tiedä, mitä tehdä sille. [Online] https://www.washingtonpost.com/news/speaking-of-science/wp/2015/07/07/sequencing-the-genome-creates-so-much-data-we-don-t-know-what-to-do-with-it.
2. GATK-JÄNNITYS [Online]
https://software.broadinstitute.org/gatk/3. Kiihdytetty genomiikka. [Online]
http://www.falconcomputing.com/falcon-accelerated-genomics-pipeline4. BWA. [Online]
http://bio-bwa.sourceforge.net/bwa.shtml5. Minimap2. [Online] https://github.com/lh3/minimap2


原因

Genomien sekvensoinnin tehostaminen FAGP (Falcon Accelerated Genomics Pipeline) -toiminnolla Intel FPGA PAC:ssa

解决方案

Falcon-kiihdytetty genomiikkaväylä, jossa on yksi Intelin FPGA-ohjelmoitava kiihdytyskortti, pystyy käsittelemään 50 kertaa kokonaisia ihmisen genomeja alle 3 tunnissa alternative variant calling pipeline -toiminnolla.

受影响的产品

Dell EMC Ready Solution Resources, PowerEdge R740XD
文章属性
文章编号: 000136278
文章类型: Solution
上次修改时间: 03 10月 2023
版本:  4
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。