第2世代インテルXeonスケーラブルプロセッサーを搭載した、ディープラーニングワークロードの高速化

Table of Contents

Detailed Article

Symptoms

Resolution

Affected Products

Provide Feedback

Summary: 人工知能, ビッグデータ, High Performance Computing, サーバー, ディープラーニング, ディープラーニングブースト, 推論, カスケードレイク, C6420

This article applies to This article does not apply to

Check out resources for

Symptoms

この文書は、2019年5月にDell EMC HPCおよびAIイノベーションラボのLucas WilisonとFrank Hanによって執筆されました。

Resolution

HPCは絶えず進化しているため、ワークロードも同じく進化しています。データセットがますます大規模かつ複雑になるにつれて、ディープラーニングなどのAIワークロードが注目を集めています。10年前には想像できなかった課題を解決する、非常にパワフルで拡張性に優れた低レイテンシーのHPCシステムで、ますます多くのディープラーニングワークロードが実行されるようになりました。ライフサイエンス、デジタル製造、石油とガス、金融などの分野における従来のHPCワークロードでは、ディープラーニングによって、データからより有意義な洞察をより短時間でより正確に生成できるようになっています。インテルは、AIメソッドが現在ではHPCワークロードの重要なコンポーネントになっていることを認識しています。AIモデルのトレーニングと、さらに重要なことにはより迅速な意思決定の簡素化という2つのニーズに対応するために、インテルはこれらのワークロードを新しい第2^nd世代インテル®Xeon®スケーラブルプロセッサー製品ラインの中心に据えました。

2^nd世代インテル®Xeon®スケーラブルプロセッサー上にある）

2^nd 第2世代インテル®Xeon®スケーラブルプロセッサーは、インテル®Optane™ DC永続メモリーの導入機能、DRAM速度の向上、従来の命令セット（単精度FP32など）の処理能力の向上など、新機能および改善された機能を多数提供します。また、新しいインテル® ディープラーニングブーストインストラクションセットを使用した、ディープラーニングワークロードの新しい処理機能を実現します。

ディープラーニングブースト（第2^nd世代インテル®Xeon®スケーラブルプロセッサー上にある）

ディープラーニングは、密なグラフに接続された多数の独立したプロセッシングユニット（ニューロン）から成る人工のニューラルネットワークを使用して、モデルを開発するプロセスです。ニューラルネットワークは、あらゆる種類のデータにおいて未知または不測のパターンを特定する驚異的な能力を示しており、画像やビデオの認識・分析から、オーディオおよび言語の変換、時系列データおよび異常検出の分析まで、幅広い分野に適用されています。

最先端のモデルを開発するためにニューラルネットワークを使用するプロセスは、次の2つのフェーズに分かれています。トレーニングでは、既存のデータを使用してニューラルネットワークにパターンを識別する方法を教えます。推論では、トレーニングを受けたモデルが新しいデータに公開され、適切な意思決定を行うことが期待されます。ニューラルネットワークのトレーニングプロセスはまた、数年前からハードウェアおよびソフトウェアの革新の中心となってきましたが、企業がAIの取り組みによって利益を得ているということが推測されています。

推論には、トレーニングとは異なるハードウェア要件があります。トレーニングには、半精度または単精度の浮動小数点演算が必要であり、同様のデータの大規模なベクトルを多数、同時に処理する能力が必要です。推論では、コンピューティング要件の合計がはるかに低く、レイテンシー（意思決定するまでの時間）に重点を置いています。また、8ビットおよび16ビットの整数などの低精度の数値形式を利用することもできます。

第2^nd世代インテル® Xeon®スケーラブルプロセッサー製品ラインは、主にこの第 2（推論）フェーズに焦点を当てています。これは、ディープラーニングブーストというまったく新しい機能を備えています。インテル®ディープラーニングブーストにより、精度演算（8ビットおよび16ビット整数）が、Xeonの512ビット幅ベクトルユニット（AVX512）に減少しました。これは、ディープラーニングブースト対応のインテル®Xeon®プロセッサーが、1つのハードウェア命令で64ビット整数8バイト（または32ビット整数16バイト）を同時に処理できるため、精度の推論を大幅に削減する機能です。この機能のほかにも、幅広い低精度ベクトルに対して、Fused Multiply Add（FMA）などの結合された操作を実行する機能を備えているため、システムのスループットが大幅に向上します。

Dell EMCは、インテル® ディープラーニングブーストがニューラルネットワークの推論を実現できるように、実現可能なパフォーマンス向上をベンチマーク化しています。上の図は、第2^nd世代インテル®Xeon®スケーラブルプロセス（インテル® ディープラーニングブーストを搭載）を導入することで、組織がどの程度改善を実現できるかを示しています。第1^st世代のインテル®Xeon®スケーラブルプロセッサー（コードネーム「Skylake」）は、ResNet-50推論ベンチマークで1秒あたり258のイメージを単精度（FP32）で処理することができ、8ビット整数の精度に減らすと1秒あたり389のイメージを処理できます。一方、ディープラーニングブーストが第2^nd 世代インテル®Xeon®スケーラブルプロセッサーにもたらす新しい手順では、8ビット整数の精度で3倍以上のスループットを実現し、1秒あたり1278のイメージを処理できます。

このことが重要な理由

これは、お客様のビジネスにとって何を意味しますか？AIモデルが作成する各推論は、以前にはなかった洞察、すなわち自動化されたワークロードであり、意思決定の障壁を排除します。これらの各洞察、および削除されたそれぞれの障壁は、新規販売、追加のアップセル、またはより迅速な投資決定に変換することができます。これは完全に御社が自由にできるお金です。

企業がデジタル変革を行う中で、AIとディープラーニングを具体的に活用することは、データ主導型の世界で競争力を維持するために不可欠です。また、AIモデルのトレーニングはこの初期段階で注目されていますが、推論は、AIのメリットを企業が真に実現するための方法です。第2^nd世代インテル®Xeon®スケーラブルプロセッサーとインテル® ディープラーニングブーストを搭載したDell EMC PowerEdgeサーバーは、より高いパフォーマンスモデル推論を実現することで、お客様のビジネスがAIの可能性を最大限に引き出すことを可能にします。そして、より優れたパフォーマンスを実現し、ビジネスの向上につなげます。

Affected Products

High Performance Computing Solution Resources, PowerEdge C6420

第2世代インテルXeonスケーラブルプロセッサーを搭載した、ディープラーニングワークロードの高速化

Summary: 人工知能, ビッグデータ, High Performance Computing, サーバー, ディープラーニング, ディープラーニングブースト, 推論, カスケードレイク, C6420

Symptoms

Resolution

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

Welcome

Welcome to Dell

第2世代インテルXeonスケーラブル プロセッサーを搭載した、ディープ ラーニング ワークロードの高速化

Summary: 人工知能, ビッグ データ, High Performance Computing, サーバー, ディープ ラーニング, ディープ ラーニング ブースト, 推論, カスケード レイク, C6420

Detailed Article

Symptoms

Resolution

Affected Products

Symptoms

Resolution

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

第2世代インテルXeonスケーラブルプロセッサーを搭載した、ディープラーニングワークロードの高速化

Summary: 人工知能, ビッグデータ, High Performance Computing, サーバー, ディープラーニング, ディープラーニングブースト, 推論, カスケードレイク, C6420