Omitir para ir al contenido principal
  • Hacer pedidos rápida y fácilmente
  • Ver pedidos y realizar seguimiento al estado del envío
  • Cree y acceda a una lista de sus productos
  • Administre sus sitios, productos y contactos de nivel de producto de Dell EMC con Administración de la empresa.

PowerScale, Isilon OneFS: Isilon'da HBase Performans Testi

Resumen: Bu makalede, YCSB karşılaştırma paketi ve CDH 5.10 kullanılarak isilon X410 kümesindeki performans karşılaştırma testleri gösterilmektedir.

Es posible que este artículo se traduzca automáticamente. Si tiene comentarios sobre su calidad, háganoslo saber mediante el formulario en la parte inferior de esta página.

Contenido del artículo


Síntomas

Gerekli değil

Causa

Gerekli değil

Resolución


Giriş

YCSB karşılaştırma paketi ve CDH 5.10 kullanarak bir Isilon X410 kümesinde bir dizi performans karşılaştırma testi gerçekleştirdik.

CAE POC laboratuvar ortamı, OneFS 8.0.0.4 ve sonraki 8.0.1.1 NFS büyük Blok akışı karşılaştırmalı testini çalıştıran 5x Isilon x410 düğümüyle yapılandırılmıştır Bu testlerden herhangi birinde teorik toplam maksimum değerlerimiz için 5 x ~700 MB/sn yazma (3,5 GB/sn) ve 5 x ~1 GB/sn okuma (5 GB/sn) beklemiz gerekir.

(9) Bilgi işlem düğümleri, 512 GB RAM ile 2,30 GHz'de 2x18C/36T-Intel Xeon® CPU E5-2697 v4 ile yapılandırılmış CentOS 7.3.1611 çalıştıran Dell PowerEdge FC630 sunucularıdır. Yerel depolama, hem işletim sistemi hem de boş alan/dökülme dosyaları için XFS olarak biçimlendirilmiş RAID 1'de 2xSSD'dir.

Ayrıca YCSB yükünü sürücüye yüklemek için kullanılan üç ek edge sunucusu da bulunur.

Bilgi işlem düğümleri ve Isilon arasındaki arka uç ağı, NIC'ler ve anahtar bağlantı noktaları için Jumbo Çerçeve seti (MTU=9162) ile 10 Gb/sn'dir.

SLN319167_en_US__1i_isilon_1arch_kb_v1a
 
CDH 5.10, Isilon'da bir Erişim Bölgesi'ne çalıştırılmış, servis hesapları Isilon Yerel sağlayıcısında ve yerel olarak istemci /etc/passwd dosyalarında oluşturulmuştur. Tüm testler, özel ayrıcalıklara sahip bir temel test kullanıcısı kullanılarak çalıştırıIıi.

Isilon istatistikleri hem IIQ hem de Grafana/Data Insights paketiyle birlikte incelenmişti. CDH istatistikleri, Cloudera Manager ve Grafana ile birlikte izlenebilir.


İlk Test

İlk test serisi, genel çıktıyı etkilenen HBASE tarafındaki ilgili parametreleri belirlemektir. HBASE için yük oluşturmak için YCSB aracını kullandık. Bu ilk test, YCSB'nin "yük" aşaması ve 40 Milyon satır kullanılarak tek bir istemci (edge server) kullanılarak çalıştırılmaktadır. Bu tablo her çalıştırmadan önce silindi.
 

ycsb load hbase10 -P workloads/workloada1 -p table='ycsb_40Mtable_nr' -p columnfamily=family -threads 256 -p recordcount=40000000

hbase.regionserver.maxlogs - Maksimum Ileri Yazma Günlüğü (VENİ) dosyası sayısı. HDFS Blok Boyutu (dfs.blocksize) ile çarpınan bu değer, sunucu çöktüğü zaman tekrar oynatılmalıdır. Bu değer, diske temizleme sıklığıyla ters orantılıdır.

hbase.ubuntu.regiongrouping.numgroups - WİVIDProvider olarak Multiple HDFSFSFS KULLANıRKEN her Bir RegionServer'ın kaç adet ileri yazma günlüklerinin çalıştırılacağını ayarlar. Bu sayıda HDFS ardışık düzeniyle sonuçlanmıştır. Belirli bir Bölge için yazma işlemi yalnızca tek bir ardışık düzene gidin ve toplam RegionServer yükünü yayın.

SLN319167_en_US__2i_isilon_2thruvspipe_kb_v1a

SLN319167_en_US__3i_isilon_3latvspipe_kb_v1a
Buraya kadar yazma işlemini paralelleştirmenin yolu, WAL sayısını artırmak ve ardından DAÜ'ye göre iş parçacığı (ardışık düzen) sayısını artırmaktır. Önceki iki tablo, belirli bir sayı için "maxlogs" 128 veya 256 için istemci tarafından gerçekten bu sayıya iten bir değişiklik olmadığını gösterir. Ancak paralelleştirmeye duyarlı parametreyi gösteren eğilim, dosya başına "ardışık düzen" sayısına göre farklılık gösterir. Bir sonraki soru, Disk G/Ç, ağ, CPU veya OneFS ile Isilon'un "nasıl bir işe yaramazsa" nerede olduğudur ve isilon istatistiklerinin rapora bakarak ne olduğuna bakarak bunu nasıl gerçekleştirebilirim?

SLN319167_en_US__4i_isilon_4networkload_kb_v1a
 
Ağ ve CPU grafikleri, Isilon kümesine az yer olduğunu ve daha fazla iş için yer olduğunu gösterir. CPU % > 80, ağ bant genişliği ise 3 GB/sn'den fazla olur.

SLN319167_en_US__5i_isilon_5proto_kb_v1a

Bu çizimlerde HDFS protokolü istatistikleri ve bunların OneFS tarafından nasıl çevril ettikleri gösterilmektedir. HDFS op'ları, burada 256 MB olan dfs.blocksize'ın katılarıdır. Burada enteresan olan şey, "Isı" grafiğinin OneFS dosya operasyonlarını görüntülemesi ve yazma ile kilitlerin bağıntısını görebilirsiniz. Bu durumda HBase, EKLENEN HER yazma işlemi için ONEFS'nin TAKİP dosyasını kilitler. Bu da kümelenmiş dosya sistemindeki kararlı yazmalar için beklentimizdir. Bu testler, bu test setine sınırlayıcı faktöre katkıda bulunuyor gibi görünür.


HBase Güncelleştirmeleri

Bir sonraki test, ölçeğinde ne olduğunu bulmak için biraz daha deneme yapmak içindi. Bu nedenle oluşturmak için iyi bir saat süren bir Milyar satırlık tablo oluşturuldu ve ardından bir YCSB, "workloada" ayarlarını kullanarak 10 milyon satır güncelleştirdi (50/50 okuma/yazma). Bu, tek bir istemcide çalıştırılmış ve ayrıca YCSB iş parçacığı sayısının bir işlevi olarak çalıştırılmam için oluştur karşılayıldığım en yüksek performansı elde etmek için de bu işlemi kullandım. Bir diğer not da Isilon'un bazı ayarlarının gerçekleştirildiğini ve Veri düğümü hizmeti için performans ayarlarına sahip OneFS 8.0.1.1'e gittiğini unutmayın. Önceki çalışma setlerine kıyasla performansta görülen bir sarsıntıyı görüntülebilir. Bu çalışmalarda hbase.regionserver.maxlogs = 256 ve hbase.rpm.regiongrouping.numgroups = 20'yi ayarlamış oluruz

SLN319167_en_US__6i_isilon_6table1_kb_v1a

SLN319167_en_US__7i_isilon_7table2_kb_v1a
SLN319167_en_US__8i_isilon_8table3_kb_v1a

Bunlara bakarak belirgin olan ilk şey, yüksek iş parçacığı sayısındaki düşüş olur. Bunun bir Isilon sorunu mu, istemci tarafı sorunu mu olduğunu çok merak ediyorum. Gelecek paragraflarda bu sorunla ilgili bazı testler daha var. Ancak 200.000'den fazla Ops'u < 3m'lik bir güncelleştirme gecikme süresiyle çalıştırmanın etkileyici olduğunu da ifade bırakabilirsiniz. Bu güncelleştirme çalışmalarının her biri hızlı oldu ve bunları birer birer gerçekleştirebilirken aşağıdaki grafik, bu çalıştırmalar için Isilon düğümlerinde eşit dengeyi gösterir.

SLN319167_en_US__9i_isilon_9heat_kb_v1a

Isı grafiğinden yine dosya işlemlerin YAZILAMA İşlemleri'nin ekleme niteliğine karşılık gelen yazma ve kilitler olduğunu görebilirsiniz.


Bölge Sunucusu Ölçeklendirmesi

Sonraki test, Isilon düğümlerinin (beş) farklı sayıda bölge sunucusuna göre nasıl ücret alacağını belirlemektir. Önceki testte çalıştırılan aynı güncelleştirme komut dosyası burada çalıştırılmış. Tek bir istemci ve 51'de YCSB iş parçacıklarıyla "workloada" kullanılarak güncelleştirilen bir Milyar satırlık tablo ve 10 milyon satır da maxlog'larda ve ardışık hatlarda (sırasıyla 256 ve 20) aynı ayarı kullanıyoruz.

SLN319167_en_US__10i_isilon_10scaling1_kb_v1a

SLN319167_en_US__11i_isilon_11scaling2_kb_v1a
 
Sonuçlar bilgilendiricidir ancak şaşırtıcı değildir. HBase'in ölçeğini genişletme yapısı, Isilon'un ölçeğini genişletme yapısıyla birleştirildiğinde ve daha fazla==daha iyi. Bu, müşterilerin kendi boyutlandırma alıştırmalarının bir parçası olarak ortamlarında çalıştırmalarını öneren bir testtir. Geri dönüşlerin azaldığını görebilirsiniz ancak burada beş Isilon düğümüne sahip dokuz ağır sunucu var ve daha fazlası için yer var gibi görünüyor.


Daha Fazla İstemci

Son test serisi, test ettiğiniz sistemi bozan derin karanlık bir yerden gelir. Ne de çok geçerli bir bilimsel yöntemdir. Test edilen parametrelerdeki üst sınırın ne olduğunu bilerek bir testi bozana kadar yeniden başlatma ve arama. Bu test serisinde, istemciyi çalıştırmak için iki ek sunucum vardı. Ayrıca her birinde iki YCSB istemcisi çalıştırarak her biri 512 iş parçacığı kullanan altı adede kadar istemciyi ölçeklendirmeme olanak sağlanmıştır. Bu da genel olarak 4096 iş parçacığı olabilir. Geri gidip 600 bölgeye ayrılmış 4 Milyar satır ve 90 bölgeye ayrılmış 400 milyon satır içeren iki farklı tablo oluşturuldu.  

 SLN319167_en_US__12i_isilon_12clientscaling1_kb_v1a

SLN319167_en_US__13i_isilon_13clientscaling2_kb_v1a

 
SLN319167_en_US__14i_isilon_14clientscaling3_kb_v1a
Bu testte tablo boyutu çok az öneme sahip. Isilon Isı grafiklerini tekrar incelerken, dört milyar satırlık tablo ile 400 Milyon satır arasındaki farklar ile çoğunlukla dahili dosya işlemleri sayısı arasında birkaç yüzde fark olduğunu görebilirsiniz.

SLN319167_en_US__15i_isilon_15row1_kb_v1a


Sonuç

HBase, genellikle ölçeği genişletme mimarileri nedeniyle Isilon'da çalıştırma için iyi bir adaydır. HBase, kendi ön belleğe alma işleminin büyük bir fazlasını gerçekleştirmektedir ve tabloyu, HBase'i verilerinizi ölçeklendirmek için iyi sayıda bölgeye böler. Başka bir deyişle, kendi ihtiyaçlarına dikkat etmek iyi bir iş çıkarır ve dosya sistemi kalıcılık için vardır. Yük testlerini gerçekten kopma noktasında itemedik ancak HBase tasarımında dört Milyar satıra baksanız ve 3 ms'den az gecikme süresiyle 800.000 işlem bekliyorsanız bu mimari bunu destekler. HBase'in kendisi için geçerli olan diğer istemci ayarları hakkında çok fazla şey değinmediyseniz tüm bu ayarların geçerli olmasını ve bu testin kapsamının ötesini beklemeniz gerekir.

 

Propiedades del artículo


Producto comprometido

Isilon, PowerScale OneFS

Fecha de la última publicación

20 set. 2023

Versión

6

Tipo de artículo

Solution