メイン コンテンツに進む
  • すばやく簡単にご注文が可能
  • 注文内容の表示、配送状況をトラック
  • 会員限定の特典や割引のご利用
  • 製品リストの作成とアクセスが可能

Dell EMC HPC NFSストレージ ソリューション - 高可用性(NSS 7.4 - HA)構成

概要: このブログでは、Dell EMC HPC NFSストレージ ソリューション バージョン7.4(NSS 7.4-HA)について説明します 。これは、「Cascade Lake」というコードネームの持つ、第2世代Intel Xeonスケーラブル プロセッサーを利用しています。

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

現象

この文書は、2019年6月にDell EMC HPCおよびAI Innovation LabのNirmala SundararajanおよびMario Gallegosによって作成されました。

原因

解決方法


ソリューションの概要

このブログでは、Dell EMC HPC NFSストレージ ソリューション バージョン7.4(NSS 7.4-HA)について説明します 。これは、「Cascade Lake」というコードネームの持つ、第2世代Intel Xeonスケーラブル プロセッサーを利用しています。  これらの改良されたXeonプロセッサーは、最大28コア、最大38.5 MBの最終レベル キャッシュ、およびソケットあたり6つの2933 MT/sメモリー チャネルを搭載しています。  カスケード Lake プロセッサーの主な機能は、サイドチャネル攻撃に対する統合ハードウェアの緩和Intel DL ブースト(vnni)、クロックスピードとメモリ速度の向上のサポートです。

Cascade Lake とその先行 Skylake には、 adddc (adaptive double d RAMdデバイスC) と呼ばれる機能があります。ADDDCは、障害が発生したDRAMデバイスを動的にマッピングするために実行時に導入され、SDDC(Single Device Data Correction)、エラー修正コード(ECC)メモリーを提供しながら、DIMMの長寿命化に対応しています。この機能は、x4 DRAMデバイスに対してのみ有効になっており、システムにx8 DRAMデバイスがある場合は何も実行されません。最新のNSS-HAバージョン7.4では、x8構成である16 GBのメモリーのみが使用されているため、ADDDCはグレー表示になり、BIOSでは調整可能なオプションではありません。ただし、32GB メモリ (x4) を使用している場合は、ADDDC を調整可能なオプションとして使用でき、RAS 機能よりもパフォーマンスを優先するために、disabled (無効) に設定することをお勧めします。

Intel Cascade Lake プロセッサー用の bios の特性」の説明に従って、HPC プロファイルを使用して NFS サーバを設定することをお勧めします。これには、サブ NUMA クラスタを有効にするための bios のチューニング、論理プロセッサの無効化、システムプロファイルの「パフォーマンス」の設定が含まれます。既存のシステムをアップグレードする場合は、CPUをCascade Lakeプロセッサーにアップグレードする前に、まずCascade Lake CPUをサポートするバージョンにBIOSがアップデートされていることを確認してください。HPCおよびAI Innovation LabのHPCエンジニアリング チームは、Cascade Lakeプロセッサーを搭載したNSSサーバーを使用した一連のベンチマーク テストを実施し、その結果を、以前にNSS7.3-HAソリューションから取得したものと比較しました。なお、当該ソリューションには旧世代の「Skylake」Xeonファミリー プロセッサーを搭載した最新バージョンのPowerEdgeサーバーを使用しました。このブログでは、ベンチマーク結果と比較について説明します。

Dell EMC によって提供される NFS ストレージソリューションは、最適なパフォーマンスを得るために最適化され、調整されています。  NSS7.4-HAソリューションのセットアップ時には、次の点に注意する必要があります。
  1. Cascade Lakeプロセッサーを使用する場合、サポートされている最小オペレーティング システムはRed Hat Enterprise Linux 7.6です。ただし、カーネル バージョン3.10.0-957.el7では、kworkerなどのタスクでNFS共有がハングアップし、CPUの100 %が消費されます。問題の根本原因は、TCPレイヤーがsunrpcレイヤーの移動状態と同期されていないことが原因です。この問題は、パッケージ「kernel-3.10.0-957.5.1 .el7」以降で解決されています。したがって、このソリューションで使用されるベース オペレーティング システムはRHEL7.6であり、使用されているカーネル バージョンはkernel-3.10.0-957.5.1.el7です。詳細については、https://access.redhat.com/solutions/3742871を参照してください。
  2. NSS7.4-HAソリューションの場合、次のパッケージがインストールされていない限り、nfs-idmapdサービスの開始に失敗するため、nfsserverリソースの起動に失敗します。詳細については、https://access.redhat.com/solutions/3746891を参照してください。
    • resource-agents-4.1.1-12.el7_6.4
    • resource-agents-aliyun-4.1.1-12.el7_6.4
    • resource-agents-gcp-4.1.1-12.el7_6.4以降。
  3. RHEL7.6のリリース ノートでは、LVMのI/Oレイヤーのバグによって、物理ボリュームの割り当て可能スペースの最初の128 KBでデータが破壊されるという事実に注目しています。  この問題は、lvm2-2.02.180-10.el7_6.2以降で解決されています。  そのため、lvm2パッケージが最新バージョンにアップデートされていることを確認してください。Lvm2をアップデートしない場合、回避策は、lvcreatelvextendなどのボリューム グループ(VG)のメタデータを変更するLVMコマンドは使用せず、VGの論理ボリュームを使用する方法です。



NSS 7.4-HAアーキテクチャ

図1は、NSS7.4-HAの設計を示しています。必要なソフトウェアおよびファームウェアのアップデートを除き、NSS7.4-HAおよびNSS7.3-HAは、同じHAクラスター構成とストレージ構成を共有します。アクティブ - パッシブHA構成のNFSサーバーのペアは、PowerVault ME4084に接続されています。各NFSサーバーには、デュアルSASカードがあります。各カードには共有ストレージ内の各コントローラーへのSASケーブルが搭載されているため、1つのSASカードまたはSASケーブルで障害が発生しても、データの可用性に影響はありません(構成の詳細については、『NSS7.3-HAホワイト ペーパー』を参照してください)。NSS 7.4-HAアーキテクチャ
SLN317325_en_US__1001
 

 

NSS 7.4-HAとNSS 7.3-HAのコンポーネントの比較

Dell NSS-HAソリューションは、最初のNSS-HAリリース以降、より高い可用性、高いパフォーマンス、および大容量のストレージ容量を提供するため、多くのハードウェアおよびソフトウェアのアップグレードを受けていますが、NSS-HAソリューション ファミリーのアーキテクチャ設計および導入ガイドラインは変更されていません。この最新バージョンとそれ以前のバージョンであるNSS7.3-HAは、Power Vault ME4084と同じストレージ バックエンドを共有しています。次の表に、最新のNSS7.4-HAソリューションと以前のNSS7.3-HAソリューションのコンポーネントの比較を示します。

 
表1:表1:NSS7.4-HAとNSS7.3-HAのコンポーネントの比較 
対処方法 NSS7.4-HAリリース(2019年6月) NSS7.3-HAリリース(2018年10月)
NFSサーバー モデル 2 Dell EMC PowerEdge R740
内部接続 Dell Networking S3048を使用したギガビットEthernet
ストレージサブシステム Dell EMC PowerVault ME4084
84-3.5 "NL SAS ドライブ、最大 12 tb。
最大 1008TB (raw スペース)
8 個の lun、リニア 8 + 2 の RAID 6、チャンクサイズの128KiB をサポートします。
4 グローバルHDDスペア。
ストレージ接続 12 Gbps SAS接続。
CPU 2 Intel Xeon Gold 6240 @ 2.6 GHz、プロセッサーあたり18コア 2 Intel Xeon Gold 6136 @ 3.0 GHz、プロセッサーあたり12コア
メモリー 12 16GiB 2933 MT/s RDIMM 12 16GiB 2666 MT/s RDIMM
オペレーティングシステム Red Hat Enterprise Linux 7.6 Red Hat Enterprise Linux 7.5
カーネル バージョン 3.10.0-957.5.1.el7.x86_64 3.10.0-862.el7.x86_64
Red Hat Scalable File System(XFS) v4.5.0-18 v4.5.0-15
外部ネットワーク接続 Mellanox ConnectX-5 InfiniBand EDR/100 GbE、および10 GbE Mellanox Connectx-3-5 InfiniBand EDR、および10 GbE。
NSS 7.3: HA ソリューションのブログでは、Mellanox の場合、、EDR/100 GbE が使用されています。
OFEDのバージョン Mellanox OFED 4.5-1.0.1.0 Mellanox OFED 4.4-1.0.0


ブログの残りの部分では、NSS7.4-HAのテストベッドおよびI/Oパフォーマンス情報について説明します。NSS7.4-HAと以前のリリースのパフォーマンスの違いを示すために、NSS7.3-HAの対応するパフォーマンス番号も提示されています。

 



テストベッドの構成

NSS7.4-HAソリューションのパフォーマンスと機能を評価するために使用されたテストベッドについて、ここで説明します。パフォーマンス テストに使用されたCPUは、この作業のためにXeon Gold 6240 CPUが時間通りに受け取れなかったため、ソリューションとして選択されたCPUとは異なることに注意してください。この計画では、6240プロセッサーが利用可能になった後にテストの一部を繰り返し、必要に応じてこのレポートを修正します。
 
表2: NSS 7.4: HA ハードウェア構成 
サーバー構成
NFSサーバー モデル Dell PowerEdge R740
CPU 2 Intel Xeon Gold 6244 CPU @ 3.60 GHz(各8コア)
メモリー 12 16GiB 2933 MT/s RDIMM
ローカル ディスクとRAIDコントローラー PERC H730Pには、5台の300 GB 15K SASハード ドライブが搭載されています。2台のドライブがRAID1でOS用に、2台のドライブがRAID0でスワップ スペース用に構成されており、5番目のドライブはRAID1ディスク グループのホット スペアです。
Mellanox EDRカード(スロット8) Mellanox ConnectX-5 EDRカード
1 GbE Ethernetカード(ドーター カード スロット) Broadcom 5720 QP 1ギガビットEthernetネットワーク ドーター カード。またはIntel(R)Gigabit 4P I350-t rNDC
外部ストレージ コントローラー(スロット1およびスロット2) 2 Dell 12 Gbps SAS HBA
システム管理 iDRAC9 Enterprise
ストレージ構成
ストレージ エンクロージャ 1 Dell PowerVault ME4084エンクロージャ
RAIDコントローラ Dell ME4084のDuplex RAIDコントローラー
Hard Disk Drives(ハードディスクドライブ) アレイあたり84 - 10 TB 7.2K NL SASドライブ、合計84 x 10ディスク
その他のコンポーネント
プライベート ギガビットEthernetスイッチ Dell Networking S3048-ON
配電ユニット 2 APCスイッチ ラックPDU、モデルAP7921B


表3: NSS 7.4: HA サーバーソフトウェアのバージョン 
コンポーネント 説明
オペレーティングシステム Red Hat Enterprise Linux(RHEL)7.6 x86_64 errata
カーネル バージョン 3.10.0-957.5.1.el7.x86_64
Cluster Suite RHEL 7.6以降のRed Hat Cluster Suite
ファイルシステム Red Hat Scalable File System(XFS)4.5.0-18
システム管理ツール Dell OpenManage Server Administrator 9.3.0-3407_A00
  

表4:NSS 7.4: HA クライアント構成 
コンポーネント 説明
サーバー 32 Dell EMC PowerEdge C6420コンピュート ノード
CPU 2 Intel Xeon Gold 6148 CPU @ 2.40 GHz(プロセッサーあたり20コア)
メモリー 12 16GiB 2666 MT/s RDIMM
オペレーティングシステム Red Hat Enterprise Linux Serverリリース7.6
カーネル バージョン 3.10.0-957.el7.x86_64
 内部接続 Mellanox InfiniBand EDR
OFEDのバージョン 4.3-1.0.1.0
ConnectX-4ファームウェア 12.17.2052
 


NSS 7.4-HA I/Oパフォーマンスの概要

このセクションでは、現在のNSS7.4ソリューションのI/Oパフォーマンス テストの結果について説明します。すべてのパフォーマンス テストは、ソリューションの最大機能を測定するために、障害のないシナリオで実施されました。このテストでは、大規模な順次読み取りと書き込み、小規模なランダム読み取りと書き込み、3つのメタデータ操作(ファイルの作成、stat、および削除)を含む、3種類のI/Oパターンに焦点を当てました。以前のバージョン NSS 7.3: HA と同様に、このソリューションでは、締切期限の i/o スケジューラと 256 NFS デーモンを使用します。

EDR 経由の IPoIB ネットワーク接続を使用して、840TB (raw ストレージサイズ) 構成が benchmarked されました。ベンチマーク テストのワークロードを生成するために、32ノードのコンピューティング クラスターを使用しました。各テストは、ソリューションの拡張性をテストするために、クライアントの範囲に対して実行されました。

この調査では、IOzone および mdtest のベンチマークが使用されています。順次テストとランダム テストでは、Iozoneが使用されました。順次テストでは、1024 KiBのリクエスト サイズが使用されました。NFSサーバー キャッシュが確実に飽和状態になるように、転送されたデータの総量は2 TBです。ランダム テストでは、4 KiBのリクエスト サイズを使用し、各クライアントは4 GiBファイルの読み取りおよび書き込みを行いました。メタデータ テストは、OpenMPIでmdtestベンチマークを使用して実施されました。これには、ファイルの作成、stat、および削除の操作が含まれています(テストで使用された完全なコマンドについては、『NSS7.3-HAホワイト ペーパー』の付録Aを参照してください)。

 

IPoIB順次書き込みおよび読み取りN-N

IOzoneベンチマークの順次読み取りおよび書き込みを評価するため、バージョン3.487が順次読み取りおよび書き込みモードで使用されました。これらのテストは、1つのスレッドから、2の累乗(最大64スレッド)で増加する複数のスレッド数に対して実施されました。このテストでは、スレッドあたり1つのファイル、またはN-Nの場合に動作するため、各スレッド数では同じ数のファイルが生成されました。2 TB の集計ファイルサイズが選択されています。これは、特定のテスト内のスレッド数に均等に分けられます。

図2は NSS 7.4-HA バージョンのシーケンシャル i/o パフォーマンスと NSS 7.3-HA バージョンの比較を示しています。図のように、最新のNSS7.4と以前のNSS7.3は、最大7 GB/sでの読み取りと、書き込みピーク パフォーマンスが5 GB/sの場合と同様のピーク パフォーマンスを備えていることが確認されました。ただし、一部のスレッド数では、NSS7.3-HAソリューションと比較すると、15~20 %の書き込みパフォーマンスの低下が測定されました。このパフォーマンスの違いについては、調査中です。読み取りパフォーマンスは、スレッド数1および2ではほぼ45 %向上し、スレッド数8では18 %向上しました。8よりも多いスレッド数については、読み取りパフォーマンスはNSS7.3-HAソリューションの場合と似ています。より少ないスレッド数での読み取りパフォーマンスの向上は、サイド チャネル攻撃に対してCascade Lakeプロセッサーに配置されているハードウェア緩和策による可能性があります。IPoIBの大規模な順次I/Oパフォーマンス

SLN317325_en_US__2image002 (3)


 

IPoIBランダム書き込みおよび読み取りN-N

ランダムIOパフォーマンスを評価するため、IOzoneバージョン3.487がランダム モードで使用されました。テストは、1から2の累乗で最大64のスレッド数に対して実施されました。レコード サイズは4 KBが選択されました。各クライアントは、小さなランダム データ アクセスをシミュレートするために、4 GiBファイルの読み取りまたは書き込みを行いました。  クラスタには32ノードのみがあるため、64スレッドのデータポイントは、2つのスレッドを実行する32クライアントを使用して取得されました。

図3は、NSS 7.4-HA のランダム書き込みと読み取り i/o のパフォーマンスを NSS 7.3-HA のものと比較したものです。図から、NSS7.4は、NSS7.3-HAと同様(最大7300 IOPS)のランダム書き込みピーク パフォーマンスを備えていることがわかります。  NSS7.4-HAソリューションの場合、1と2より少ないスレッド数では、書き込みパフォーマンスは以前のバージョンのソリューションと比べて約14 %低下します。これについては、調査中です。  ランダム読み取りパフォーマンスは、NSS7.4で徐々に増加し、64スレッドで16607 IOPSのピーク パフォーマンスに達します。以前のリリース(NSS7.3-HA)では、32スレッドで28811 IOPSのピーク パフォーマンスに達しました。これは、NSS7.4-HAソリューションのランダム読み取りにおいて達成されたピーク パフォーマンスよりも42 %高くなっています。IPoIBのランダムI/Oパフォーマンス

SLN317325_en_US__303 (1)

 

IPoIBメタデータの操作

システムのメタデータ パフォーマンスを評価するため、MDTestツール バージョン1.9.3が使用されました。使用されたMPI分配は、OpenMPIバージョン1.10.7です。  表5のように、メタデータ テストは、スレッド数最大32に対して960,000ファイルを作成し、ファイル数を増やして、ソリューションの拡張性をテストすることによって実施されました。メタデータテスト: スレッド間でのファイルとディレクトリの分散 
スレッド数 ディレクトリーあたりのファイル数 スレッドあたりのディレクトリー数 ファイルの総数
1 3000 320 960000
2 3000 160 960000
4 3000 80 960000
8 3000 40 960000
16 3000 20 960000
32 3000 10 960000
64 3000 8 1536000
128 3000 4 1436000
256 3000 4 3072000
512 3000 4 6144000


図4、図5、および図6は、ファイルの作成、stat、および削除の各操作の結果を示しています。HPCコンピューティング クラスターには32のコンピューティング ノードがあり、次のグラフでは、各クライアントは最大32に対してノードごとに1つのスレッドを実行しました。64、128、256、および512のクライアント数については、各ノードが2、4、8、または16の同時操作を実行しました。
ファイルの作成時には、16スレッドまではパフォーマンスが20 %向上し、32スレッド以降は、両方のバージョンのパフォーマンスはほぼ同じです。
NSS 7.4 での Stat 操作では、低スレッド数 (1、2、8、16) のパフォーマンスが10% 向上 > し、より高いスレッド数 (64 スレッドから512スレッド) のパフォーマンスが30% 低下します。
最後に、削除操作では、64クライアントまでのパフォーマンスが14% 低下しました。128256と512のスレッド数が増加すると、> 20% 低下していました。

 
図4:IPoIB ファイルの作成パフォーマンス
SLN317325_en_US__404 (1)


図 5: IPoIB fiel のパフォーマンス
SLN317325_en_US__505 (1)


図 6: IPoIB fie のパフォーマンスの削除
SLN317325_en_US__606 (1)


 

結論

次の表は、最後のNSS7.4およびNSS7.3ソリューション間で観察されたパフォーマンスの違いをまとめたものです。 表5:NSS7.4およびNSS7.3 HAバージョンのパフォーマンスの比較
Dell EMC HPC NFSストレージ NSS7.4-HA NSS7.4 – HA NSS7.3-HA
順次1MB 書き込みのピーク: 1.4% の減少 4,834 MB/秒 4,906 MB/秒
順次1MB 読み取りのピーク: 0.7% の減少 7,024 MB/秒 7,073 MB/秒
ランダム4KB 書き込みのピーク: 0.7% の減少 7,290 IOps 7,341 IOps
ランダム4KB 読み取りのピーク: 42% の減少 16,607 IOps 28,811 IOps
Create operations/second のピーク: 1.1% の減少 54,197 Op/s 54,795 Op/s
Stat 操作/秒のピーク: 35% の減少 522,231 Op/s 808,317 Op/s
削除操作/秒のピーク: 35% の減少 47,345 Op/s 73,320 Op/s


上記の結果から、現在のNSS7.4-HAソリューションは、前世代のNSS7.3-HAソリューションと同等のパフォーマンスを提供していると分かりました。デルでは、プロセッサーあたり18コアのXeon Gold 6240 CPUを使用してベンチマーク テストを実施することを計画しています。これにより、ランダム読み取りパフォーマンスが低下し、ファイルのstatおよび削除操作におけるより高いスレッド数でのパフォーマンス低下が、NSS7.4-HAソリューションのパフォーマンス ベンチマークに使用されるXeon Gold 6244 CPU(プロセッサーあたり8コア)のコア数が少ないことに起因しているかどうかを理解できます。



リファレンス

NSS-HAソリューションの詳細については、公開されているホワイト ペーパーを参照してください。

 

対象製品

High Performance Computing Solution Resources
文書のプロパティ
文書番号: 000145124
文書の種類: Solution
最終更新: 28 2月 2021
バージョン:  4
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。