Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

PowerScale, Isilon OneFS: HBase-suorituskykytestaus Isilonilla

Summary: Tässä artikkelissa on tietoja Isilon X410 -klusterin suorituskyvyn vertailutesteistä YCSB-vertailuohjelmistolla ja CDH 5.10 -levyllä.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Ei tarvita

Cause

Ei tarvita

Resolution

HUOMAUTUS: Tämä aihe on osa Hadoop-työkalun käyttöä OneFS-tietokeskuksessa. 


Johdanto

Suoritimme isilon X410 -klusterin suorituskyvyn vertailutestejä käyttämällä YCSB-vertailusarjaa ja CDH 5.10 -versiota.

CAE POC -testiympäristössä oli 5x Isilon x410 -solmua, joissa on OneFS 8.0.0.4 ja sitä uudemmat 8.0.1.1 NFS -suurten lohkojen suoratoistovertailut testien teoreettisten enimmäiskokojen pitäisi odottaa olevan 5 –700 Mt/s kirjoitustoimintoa (3,5 Gt/s) ja 5 –1 Gt/s (5 Gt/s).

(9) Laskentasolmuja ovat Dell PowerEdge FC630 -palvelimet, joissa on CentOS 7.3.1611, joista jokaisessa on 2 x 18C/ 36T-Intel Xeon® CPU E5-2697 v4 ja 2,30 GHz ja 512 Gt RAM-muistia. Paikallinen tallennustila on 2 xSSD RAID 1 -kokoonpanossa, joka on alustettu XFS-muotoon sekä käyttöjärjestelmässä että naarmuuntumistilassa/läikkymistiedostoissa.

Lisäksi YCSB-kuormitusta käytettiin kolmella lisäpalvelimella.

Laskentasolmujen ja Isilonin taustaverkko on 10 Gbps ja verkkokorttien ja kytkinporttien Jumbo-kehykset (MTU=9162).

SLN319167_en_US__1i_isilon_1arch_kb_v1a
 
CDH 5.10 on määritetty toimimaan Isilonin käyttöalueella, palvelutilit luotiin Isilonin paikallisessa palveluntarjoajassa ja paikallisesti asiakkaan /etc/passwd-tiedostoissa. Kaikki testit suoritettiin käyttämällä perustestikäyttäjää, jolla ei ollut erityisiä oikeuksia.

Isilon-tilastoja valvottiin sekä IIQ- että Grafana/Data Insights -paketilla. CDH-tilastoja valvottiin Cloudera Managerilla ja myös Grafanalla.


Alkutestaus

Ensimmäisessä testisarjassa määritettiin HBASE-puolella tarvittavat parametrit, jotka vaikuttivat kokonaistulokseen. YCSB-työkalulla kuormitimme HBASE-tietokannan. Alkutesti suoritettiin yhdellä työasemalla (Edge-palvelimella) YCSB-tietokannan load-vaiheessa ja 40 miljoonalla rivillä. Tämä taulukko poistettiin ennen jokaista suoritusta.
 

ycsb load hbase10 -P workloads/workloada1 -p table='ycsb_40Mtable_nr' -p columnfamily=family -threads 256 -p recordcount=40000000

hbase.regionserver.maxlogs - KIRJOITUS-Ahead-lokitiedostojen enimmäismäärä. Tämä arvo kerrottuna HDFS-lohkon koolla (dfs.blocksize) on SEN KOON KOOT, joka on toistettava palvelimen kaatuessa. Tämä arvo on käänteisessä suhteessa levyn tyhjennysten taajuudeseen.

hbase.solmu.regiongrouping.numgroups : kun KÄYTÖSSÄ on USEITA HDFS-piirtolevyjä VERKKOSOLProviderina, määritä, miten monta Write-ahead-lokia RegionServerin pitäisi suorittaa. Tämä johtaa tähän HDFS-pipeline-siirtojen määrään. Tietyn alueen kirjoitusohjelmat siirtyvät vain yhteen liitäntään, mikä jakaa RegionServer-kuormituksen kokonaismäärän.

SLN319167_en_US__2i_isilon_2thruvspipe_kb_v1a

SLN319167_en_US__3i_isilon_3latvspipe_kb_v1a
Tämän oli tarkoitus rinnakkaistaa mahdollisimman monta kirjoitusta, joten WALien määrän lisääminen ja SEN jälkeen Säikeiden (pipeline) määrä VOI saavuttaa tämän. Kahdesta edellisestä taulukosta näkyy, että tietyn maxlogs-numeron 128 tai 256 kohdalla ei näy todellista muutosta, mikä osoittaa, että emme todellisuudessa lisää tätä numeroa työasemasta toiseen. Tiedostokohtainen pipeline-toimintojen määrä vaihtelee kuitenkin trendin mukaan, joka ilmaisee rinnakkaistukselle herkän parametrin. Seuraava kysymys on, missä Isilon "estää" Isilonin levyn I/O:n, verkon, suorittimen tai OneFS:n avulla, ja voimme tarkastella Isilonin tilastoraporttia.

SLN319167_en_US__4i_isilon_4networkload_kb_v1a
 
Verkon ja suorittimen kaaviot kertovat, että Isilon-klusteria käytetään liian vähän ja että siinä on enemmän työtä. Suorittimen koko olisi > 80 % ja verkon kaistanleveys yli 3 Gt/s.

SLN319167_en_US__5i_isilon_5proto_kb_v1a

Näissä välityspalstoja ovat HDFS-protokollan tilastot ja oneFS:n kääntämät tiedot. HDFS ops on useita dfs.blocksize-tiedostoita, joiden koko on tässä 256 Mt. Kiinnostavaa tässä on se, että Lämpö-kaavio näyttää OneFS-tiedostotoiminnot ja kirjoitusten ja lukkojen korreloinnin. Tässä tapauksessa HBase tekee liitännät YHTEENSTYM-tiedostoihin, joten OneFS lukitsee JOKAista lisättyä kirjoitusta varten TIEDOT-tiedoston. Tämä vastaa klusteroitujen tiedostojärjestelmien vakaata kirjoitusta. Nämä vaikuttavat osaltaan näiden testien rajoitintekijään.


HBase-päivitykset

Seuraava testi oli kokeilla tarkemmin, mitä asteikolla tapahtuu, joten loin yhden miljardin rivin taulukon, jonka luonti kesti hyvän tunnin, ja suoritin YCSB-testin, joka päivitti 10 miljoonaa riviä kuormitusasetuksilla (50/50 luku/kirjoitus). Tämä suoritettiin yhdessä työasemassa, ja etsin myös suurinta mahdollista siirtonopeutta, joten suoritin tämän YCSB-säikeiden määrän toimintona. Lisäksi suoritimme Isilon-viritystä ja valitsimme OneFS 8.0.1.1 -versioon, jossa datasolmupalvelun suorituskykyä on muutettu. Suorituskyvyssä näkyy edellisiin versioihin verrattuna suorituskyvyn heikkeneminen. Näitä tyksiä varten määritetään hbase.regionserver.maxlogs = 256 ja hbase.solmu.regiongrouping.numgroups = 20

SLN319167_en_US__6i_isilon_6table1_kb_v1a

SLN319167_en_US__7i_isilon_7table2_kb_v1a
SLN319167_en_US__8i_isilon_8table3_kb_v1a

Kun näitä tarkastellaan, ensimmäinen ongelma on, että putoamisen säikeiden määrä on suuri. Oliko kyseessä Isilon-ongelma vai asiakaspuolen ongelma? Tulevissa kappaleissa on joitakin lisätestejä. Voin kuitenkin todeta, että yli 200 000 käyttöiän ohjaaminen päivitysviiveen ollessa < 3 ms on vaikuttava. Kukin päivitys toimi nopeasti, ja pystyin tekemään ne yksi kerrallaan. Seuraava kaavio osoittaa näiden päivitysten tasaisen tasapainon Isilon-solmuissa.

SLN319167_en_US__9i_isilon_9heat_kb_v1a

Lämpökaaviosta näkyy myös, että tiedostotoiminnot ovat KIRJOITUS- ja lukitustoimintoja, jotka vastaavat AUTOMATISOINTI-prosessien liitännässä näkyvää luontoa.


Alueen palvelinten skaalaus

Seuraava testi oli määrittää, miten Isilon-solmut (viisi niistä) menestyisivät eri aluepalvelimien kanssa. Sama edellisen testin päivityskomentosarja suoritettiin tässä. Yhden miljardin rivin taulukko ja 10 miljoonaa riviä päivitettiin workloada-komennolla yhden työaseman ja YCSB-säikeen avulla 51:een. Sama asetus säilyi myös enimmäis- ja pipeline-asemissa (vastaavasti 256 ja 20).

SLN319167_en_US__10i_isilon_10scaling1_kb_v1a

SLN319167_en_US__11i_isilon_11scaling2_kb_v1a
 
Tulokset ovat informatiivisia, ei yllättäviä. HBasen skaalautuvuus ja Isilonin skaalautuvuus ja enemmän==parempi. Suosittelen, että asiakkaat suorittavat tämän testin ympäristöissään osana omaa mitoitusansa. Palautukset saattavat heikentyä, mutta täällä on yhdeksän palvelimea, jotka työntävät viittä Isilon-solmua, ja näyttää siltä, että siinä on enemmän tilaa.


Enemmän asiakkaita

Testien viimeinen sarja tulee siitä syvästä pimeästä paikasta, jossa haluat hajottaa testaamaasi järjestelmää. Onhan se täysin pätevä tapa testata testiä, kunnes tilanne hajoaa, ja tietää testattavien parametrien ylärajan. Tässä testisarjassa minulla oli kaksi lisäpalvelinta, joiden avulla suoritin työaseman. Lisäksi suoritin kummassakin kaksi YCSB-asiakasohjelmaa, joiden avulla voin skaalata kuhunkin 512 säikeeseen, mikä olisi 4 096 säiettä. Olen luonut kaksi taulukkoa, joista toinen on 4 miljardia riviä jaettu 600 alueeseen ja toinen 400 riviä jaettu 90 alueeseen.  

 SLN319167_en_US__12i_isilon_12clientscaling1_kb_v1a

SLN319167_en_US__13i_isilon_13clientscaling2_kb_v1a

 
SLN319167_en_US__14i_isilon_14clientscaling3_kb_v1a
Kuten näet, taulukon koolla on vain vähän merkitystä tässä testissä. Kun tarkastelet Isilon Heat -kaavioita uudelleen, huomaat, että tiedostotoimintojen määrässä on muutama prosenttiero, joka liittyy lähinnä neljän miljardin rivin taulukon ja 400 miljoonan rivin eroihin.

SLN319167_en_US__15i_isilon_15row1_kb_v1a


Johtopäätös

HBase on hyvä kandidaatti Isilon-suorittimiin lähinnä skaalautuvien arkkitehtuurien vuoksi. HBase tekee monia omia välimuistitallennustaan ja jakaa taulukon useille alueille, joilla HBase skaalautuu tietoihin. Toisin sanoen se tekee hyvää työtä huolehtiakseen omista tarpeistaan, ja tiedostojärjestelmä on luotettava. Kuormitustestit eivät ehtineet hajottaa asioita, mutta jos katsot HBase-mallissasi neljää miljardia riviä ja odotat 800 000 toimintoa alle 3 ms:n viiveellä, tämä arkkitehtuuri tukee sitä. Jos havaitset, että en ole maininnut paljonkaan muita asiakaspuolen säätöjä, joita voit käyttää itse HBasessa, oletan, että kaikki nämä muutokset ovat edelleen voimassa, eivätkä ne sisälly tähän testiin.

 

Affected Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000128942
Article Type: Solution
Last Modified: 20 Sep 2023
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.