Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Ускорение рабочих нагрузок глубинного обучения с помощью масштабируемых процессоров Intel Xeon 2-го поколения

Summary: Искусственный интеллект, большие данные, высокопроизводительные вычисления, серверы, глубинное обучение, Deep Learning Boost, логические выводы, Cascade lake, C6420

This article applies to   This article does not apply to 

Symptoms

Статья сотрудников лаборатории Dell EMC HPC & AI Innovation Lab Лукаса Уилисона (Lucas Wilison) и Франка Хэна (Frank Han), май 2019 г.

Resolution

 Высокопроизводительные вычисления постоянно развиваются, и вслед за ними развиваются и рабочие нагрузки. По мере роста и усложнения наборов данных на первый план выходят рабочие нагрузки искусственного интеллекта (ИИ), такие как глубинное обучение. Сегодня все больше и больше рабочих нагрузок глубинного обучения запускаются на мощных, масштабируемых высокопроизводительных вычислительных системах (HPC) с низким уровнем задержек. Эти системы позволяют решать задачи, о которых еще десять лет назад нельзя было даже подумать. Традиционные рабочие нагрузки HPC в медико-биологических науках, цифровом производстве, нефтегазовой промышленности, финансовой сфере и других отраслях активно развиваются благодаря глубинному обучению, которое позволяет извлекать более эффективную аналитическую информацию из данных за меньшее время и с большей точностью. Корпорация Intel считает, что методы искусственного интеллекта теперь являются критически важными компонентами рабочих нагрузок HPC. Чтобы удовлетворить потребность в обучении и, что более важно, ускорить принятие решений для моделей ИИ, корпорация Intel вывела эти рабочие нагрузки на передний план с помощью новыхnd масштабируемых процессоров Intel® Xeon® 2-го поколения.

2nd масштабируемых процессорах Intel® Xeon® 2-го поколения

2nd Масштабируемые процессоры Intel® Xeon® 2-го поколения предлагают множество новых и улучшенных возможностей, включая поддержку энергонезависимой памяти Intel® Optane™ DC, повышение скорости DRAM, расширенные возможности обработки традиционных наборов команд, таких как Single Precision FP32, а также новые возможности обработки для рабочих нагрузок глубинного обучения благодаря новому набору команд Intel® Deep Learning Boost.

Deep Learning Boost наnd масштабируемых процессорах Intel® Xeon® 2-го поколения

Глубинное обучение — это процесс разработки моделей с использованием искусственных нейронных сетей, состоящих из множества независимых процессорных устройств, или нейронов, подключенных к графу высокой плотности. Нейронные сети продемонстрировали удивительную способность выявлять неизвестные или непредвиденные закономерности во всех типах данных. Они применялись в различных областях: от распознавания и анализа изображений и видео до преобразования звука и языка, анализа данных временного ряда и выявления аномалий.

Процесс использования нейронных сетей для разработки передовых моделей состоит из двух этапов: обучения, где существующие данные используются для обучения нейронной сети определению закономерностей, и создания выводов, где обученная модель получает новые данные и должна принимать соответствующие решения. На протяжении нескольких лет инновации в области аппаратного и программного обеспечения были направлены на обучение нейронных сетей, однако сейчас компании получают реальные преимущества при развертывании ИИ для создания логических выводов.

Для создания логических выводов требуется совершенно другое оборудование, нежели для обучения. Для обучения необходимо выполнение арифметических операций с плавающей запятой половинной или одинарной точности, а также возможность одновременной обработки большого количества векторов похожих данных. Логические выводы снижают требования к общей вычислительной мощности, они больше зависят от уровня задержки (времени принятия решения) и могут использовать числовые форматы с низкой точностью, такие как 8-разрядные и 16-разрядные целые числа.

The 2nd Масштабируемые процессоры Intel® Xeon® 2-го поколения, оснащенные совершенно новой технологией, известной как Deep Learning Boost, ориентированы в первую очередь на вторую фазу (создание логических выводов). Intel® Deep Learning Boost обеспечивает арифметические вычисления с пониженной точностью (8- и 16-разрядных целых чисел) для 512-разрядных векторных блоков Xeon (AVX512). Это предоставляет огромные преимущества в области создания логических выводов пониженной точности, поскольку процессоры Intel® Xeon® с технологией Deep Learning Boost могут одновременно обрабатывать 64 8-разрядных целых чисел (или 32 16-разрядных целых чисел) в одной аппаратной инструкции! А возможность выполнения операций с округлением, таких как Fused Multiply Add (FMA), в этих векторах с низкой точностью позволяет значительно повысить пропускную способность системы.

Корпорация Dell EMC протестировала реальные улучшения производительности, которые технология Intel® Deep Learning Boost может обеспечить для создания логических выводов нейронной сети. На приведенном выше рисунке показано, каких улучшений может добиться ваша организация благодаря развертываниюnd масштабируемых процессоров Intel® Xeon® 2-го поколения с технологией Intel® Deep Learning Boost. Тогда какst масштабируемые процессоры Intel® Xeon® 1-го поколения (кодовое название Skylake) способны обрабатывать 258 изображений в секунду на эталонном тесте создания логических выводов ResNet-50 с одинарной точностью (FP32) и 389 изображений в секунду при сниженной точности 8-разрядных целых чисел, новые инструкции, которые обеспечивает технология Deep Learning вnd масштабируемых процессорах Intel® Xeon® 2-го поколения, способны в три раза увеличить пропускную способность вычисления 8-разрядных целых чисел до 1278 изображений в секунду!

Почему это важно

Что это означает для вашего бизнеса? Каждый вывод, который создает ваша модель ИИ, представляет собой уникальную аналитическую информацию или автоматизированную рабочую нагрузку, которая устраняет препятствия для принятия решения. Каждая часть этой аналитической информации — каждый из этих устраненных препятствий — может привести к новой продаже, дополнительной продаже или ускорению принятия решения об инвестиции. Это прибыль вашей компании.

Поскольку компании подвергаются цифровой трансформации, использование ИИ (и в особенности глубинного обучения) будет критически важным условием для сохранения конкурентоспособности в мире, ориентированном на данные. И хотя обучение моделей ИИ было приоритетной задачей на раннем этапе, логические выводы — это то, что позволяет компаниям по-настоящему реализовать преимущества ИИ. Серверы Dell EMC PowerEdge на базеnd масштабируемых процессоров Intel® Xeon® 2-го поколения с технологией Intel® Deep Learning Boost помогут вашей компании раскрыть весь потенциал ИИ за счет более производительной модели формирования выводов. А более высокая производительность способствует успешному развитию бизнеса.

 

Affected Products

High Performance Computing Solution Resources, PowerEdge C6420