Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Масштабируемость готовых решений Dell для хранилищ НРС BeeGFS

Summary: Масштабируемость готовых решений Dell для хранилищ НРС BeeGFS.

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Как масштабировать высокопроизводительное решение для хранения данных Dell BeeGFS с точки зрения емкости, производительности или того и другое?

Cause

См. информацию в разделе «Способ устранения».

Resolution

Содержание

  1. Введение
  2. Базовые конфигурации
  3. Расчет полезного пространства BeeGFS
  4. Масштабируемые конфигурации
  5. Характеристики производительности
  6. Выводы и планы на будущее
     

Введение

В этом блоге рассматривается масштабируемость готовых решений Dell EMC для хранилищ НРС BeeGFS , о которых было объявлено на недавнем выпуске.  Архитектура BeeGFS состоит из четырех основных сервисов, службы управления, сервиса метаданных, службы хранения данных и клиентских сервисов. На одном сервере можно запускать любое сочетание этих четырех основных сервисов, включая все, потому что роли и оборудование не тесно интегрированы в случае BeeGFS.  В «гиперконвергентных решениях» все четыре сервиса работают на одном сервере. Такая конфигурация не рекомендуется для сред, в которых важна производительность, поскольку клиентские приложения обычно потребляют ресурсы, что может повлиять на производительность сервисов хранения данных. В решении Dell EMC используются выделенные серверы хранения данных, а также сервер для метаданных и хранения данных двух целей. Это высокопроизводительное масштабируемое решение для хранения данных. Можно масштабировать систему, добавляя дополнительные серверы хранения данных в существующую систему. В этом блоге мы рассмотрим конфигурации с разным количеством серверов хранения данных и производительность, которую можно ожидать в этих конфигурациях.

Базовые конфигурации

Решение для хранения данных BeeGFS, предназначенное для высокопроизводительной файловой системы, использует следующие аппаратные компоненты:

  • Сервер управления
    • R640, два процессора Intel Xeon Gold 5218, 2,3 ГГц, 16 ядер, 96 Гбайт (12x 8 Гбайт 2666 MT/с RDIMM), 6 x 15 000 об/мин SAS 300 Гбайт, H740P
  • Серверы метаданных и хранения данных
    • R740xd, 2 процессора Intel Xeon Platinum 8268, 2,90 ГГц, 24 ядра, 384 Гбайт (12 модулей RDIMM по 32 Гбайт, 2933 МТ/с)
    • Плата BOSS с 2 твердотельных накопителя M.2 SATA емкостью 240 Гбайт в RAID 1 для ОС
    • 24 накопителя, Intel 1,6 Тбайт, NVMe, Mixed Use Express Flash, 2,5 накопителя SFF, программный RAID

На сервере управления работает служба мониторинга BeeGFS. Сервер метаданных использует 12 накопителей в зоне NUMA 0 для хостов целевых метаданных (MDTS), а остальные 12 дисков в зоне NUMA 1 размещают целевые системы хранения данных (STS). Выделенный сервер метаданных не используется, так как требования к емкости хранилища для метаданных BeeGFS очень малы. Целевые данные и сервисы метаданных и хранилища изолированы на отдельных узлах NUMA, чтобы было установлено значительное разделение рабочих нагрузок. Серверы хранения данных, используемые в конфигурации, имеют три службы хранения данных, работающие на одну зону NUMA, в общей сложности шесть на сервер. Дополнительные сведения см. в блоге с объявлением о выходе. На рис. 1 показаны две базовые конфигурации, которые были протестированы и валидированы в лаборатории Dell EMC HPC and AI Innovation Lab.

SLN319382_en_US__1baseconfigsupload

Рис. 1. Базовые конфигурации

Небольшая конфигурация состоит из трех серверов R740xd. Оно содержит в общей сложности 15 целевых систем хранения. Средняя конфигурация содержит 6 серверов R740xd и в общей сложности 33 целевых ресурса хранения. Пользователь может начать с конфигурации «Small» или «Medium» и при необходимости добавить серверы хранения или метаданных, чтобы увеличить пространство для хранения данных и общую производительность, а также увеличить производительность файлов и метаданных соответственно. В табл. 1 показаны данные о производительности базовых конфигураций, которые были тщательно протестированы и валидированы в лаборатории Dell EMC HPC and AI Innovation Lab.

Базовая конфигурация Маленький Medium
Всего U (MDS+SS) 6U 12U
Количество выделенных серверов хранения данных 2. 5.
Количество накопителей NVMe для хранения данных 60 132
Расчетное полезное пространство 1,6 TB 86 ТиБ 190 ТиБ
3,2 Тбайт 173 ТиБ 380 ТиБ
6,4 Тбайт 346 ТиБ 761 ТиБ
Последовательное чтение пикового значения 60,1 Гбайт/с 132,4 Гбайт/с
Пиковая последовательная запись 57,7 Гбайт/с 120,7 Гбайт/с
Произвольное чтение 1,8 млн IOPS 3,54 млн IOPS
Случайная запись 1,84 млн IOPS 3,59 млн IOPS

Таблица 1. Сведения о емкости и производительности базовых конфигураций

 


Расчет полезного пространства BeeGFS

Расчет предполагаемого полезного пространства в ТиБ (поскольку большинство инструментов показывают полезное пространство в двоичных единицах) с помощью следующей формулы:


Полезное пространство BeeGFS в ТиБ= (0,99* количество накопителей* в Тбайт* (10^12/2^40)

В приведенной выше формуле 0,99 — это фактор, на который на 1% меньше издержки файловой системы.  Для получения информации о количестве накопителей для хранения также включены 12 накопителей из MDS. Это потому, что в MDS 12 накопителей в зоне NUMA 0 используются для метаданных, а 12 накопителей в зоне NUMA 1 используются для хранения. Последний фактор в формуле 10^12/2^40 — преобразование полезного пространства из терабайта в ТиБ.

Масштабируемые конфигурации

Высокопроизводительное решение для хранения данных BeeGFS разработано как гибкое, которое можно легко и просто масштабировать, добавляя дополнительные серверы, как показано ниже.
SLN319382_en_US__2scale4
             Рис. 2. Примеры масштабируемой конфигурации 

Метаданные в стеке остаются неизменными для всех вышеуказанных конфигураций, описанных в этом блоге. Это потому, что требования к емкости хранилища для метаданных BeeGFS обычно составляет от 0,5% до 1% от общей емкости хранилища. Однако это зависит от количества каталогов и файлов в файловой системе. Как правило, пользователь может добавить дополнительный сервер метаданных, если процент емкости метаданных в хранилище падает ниже 1%. В табл. 2 показаны данные по производительности для различных гибких конфигураций решения для хранения данных BeeGFS.

 
Настройка Маленький Компактная конфигурация +1 Компактная конфигурация +2 Medium Средний +1
Всего U (MDS+SS) 6U 8U 10U 12U 14U
Количество выделенных серверов хранения данных 2. 3. 4 5. 6
Количество накопителей NVMe для хранения данных 60 84 108 132 156
Расчетное полезное пространство 1,6 TB 86 ТиБ 121 ТиБ 156 ТиБ 190 ТиБ 225 ТиБ
3,2 Тбайт 173 ТиБ 242 ТиБ 311 ТиБ 380 ТиБ 449 ТиБ
6,4 Тбайт 346 ТиБ 484 ТиБ 622 ТиБ 761 ТиБ 898 ТиБ
Последовательное чтение пикового значения 60,1 Гбайт/с 83,3 Гбайт/с 105,2 Гбайт/с 132,4 Гбайт/с 152,9 Гбайт/с
Пиковая последовательная запись 57,7 Гбайт/с 80,3 Гбайт/с 99,8 Гбайт/с 120,7 Гбайт/с 139,9 Гбайт/с

Таблица 2. Сведения о емкости и производительности в масштабируемых конфигурациях

 

Характеристики производительности

Производительность различных конфигураций была протестирована путем создания пулов хранения данных. В небольших конфигурациях имеется 15 целевых объектов для хранения данных, и каждый дополнительный сервер хранения добавляет дополнительные шесть целевых систем хранения. Таким образом, для тестирования производительности различных конфигураций пулы хранения данных были созданы из 15–39 целевых систем хранения (инкрементами по шесть для небольших, небольших+1, малых +2, средних и более 1). Для каждого из этих пулов были выполните три итераации эталонного теста iozone, каждый из них с 1 до 1024 потоков (с помощью двух инкрементов). Внедренная методология тестирования такая же, как описана в блоге с объявлением о выходе . На рисунках 3 и 4 показана производительность операций записи и чтения в масштабируемых конфигурациях соответственно, а максимальная производительность каждой из конфигураций выделена для справки:


  SLN319382_en_US__3image003(2)
Рис. 3.  Производительность записи масштабируемых конфигураций


SLN319382_en_US__4image004Рис. 4.  Производительность масштабируемых конфигурацийПримечание

.

Пул хранения данных, упомянутый здесь, был создан только с явной целью характеристики производительности различных конфигураций.  При оценке производительности средней конфигурации, подробно описанной в блоге с объявлением о выходе, все 33 цели были только в пуле по умолчанию. В выходных данных команды beegfs-ctl --liststoragepools, приведенной ниже, показано назначение целевых ресурсов хранения:

# beegfs-ctl --liststoragepools Pool ID Pool Description Targets /Targets
/1======= ================== ============================ ============================
Default
1,2,3,4,5,6,7,8,9,10,11,12
по умолчанию                                                 13, 14, 15, 16, 17, 18, 19, 20, 21,
22, 23, 24, 25, 26, 27, 28, 29,30,
31, 32, 333  


Выводы и планы на будущее

В этом блоге рассматривается масштабируемость готовых решений Dell EMC для хранилищ BeeGFS для высокопроизводительных вычислений, а также производительность последовательных операций чтения и записи в различных конфигурациях. Следите за новостями в части 3 этого блога, в котором рассматриваются дополнительные функции BeeGFS, а также будет рассмотрено использование функции StorageBench — эталонного теста beeGFS для целевых систем хранения данных. В рамках следующих шагов мы опубликуем позже технический документ с оценкой производительности метаданных, оценкой производительности IOR N-1 и дополнительными сведениями о проектировании, настройке и конфигурации. 


Справочные материалы

[1] Готовые решения Dell EMC для хранилищ НРС BeeGFS:  
https://www.dell.com/support/article/sln319381/[2] Документация по BeeGFS: 
https://www.beegfs.io/wiki/[3] Как подключить два интерфейса в одной подсети: 
https://access.redhat.com/solutions/30564[4] Эталонный дизайн доступа к памяти PCI Express Direct с использованием внешней памяти: https://www.intel.com/content/www/us/en/programmable/documentation/nik1412547570040.html#nik1412547565760

 

Article Properties


Affected Product

PowerSwitch S3048-ON, Mellanox SB7800 Series, PowerEdge R640, PowerEdge R740XD

Last Published Date

03 Oct 2023

Version

5

Article Type

Solution