HPC, sürekli olarak gelişir ve buna bağlı olarak iş yükü de sürekli gelişim halindedir. Veri setleri daha büyük ve karmaşık hale geldikçe Derin Öğrenme gibi yapay zeka iş yükleri de ilgi odağı olmaya başladı. Günümüzde, bundan on yıl önce hayal bile edilmeyen sorunları çözen güçlü, ölçeklenebilir, düşük gecikme süreli HPC sistemlerinde zaman geçtikçe daha fazla Derin Öğrenme iş yükleri çalıştırılıyor. Yaşam Bilimleri, Dijital İmalat, Petrol ve Akaryakıt, Finans gibi alanlardaki geleneksel HPC iş yükleri Derin Öğrenme'nin etkisiyle verilerden daha kısa zamanda ve daha doğru biçimde anlamlı sonuçlar çıkarıyor. Intel, yapay zeka yöntemlerinin artık HPC iş yükünün önemli bileşenlerinden olduğunun farkında. Intel, yapay zeka modellerinin eğitimi ve daha önemli olarak daha hızlı karar vermelerini kolaylaştırma ihtiyaçlarına değinmek için bu iş yüklerini, 2. Nesil Intel® Xeon® Ölçeklenebilir işlemci serisi ile önceliklenmiştir.
2. Nesil Intel® Xeon® Ölçeklenebilir İşlemciler
2. Nesil Intel® Xeon® Ölçeklenebilir İşlemciler; Intel® Optane™ DC Kalıcı Bellek dağıtım özelliği, iyileştirilmiş DRAM hızı, tek duyarlıklı FP32 gibi geleneksel talimat setleri için daha yüksek işleme kapasitesi ve yeni Intel® Deep Learning Boost talimat setiyle Derin Öğrenme iş yükleri için yeni işleme kapasitesi gibi yeni ve iyileştirilmiş özellikler sunar.
2. Nesil Intel® Xeon® Ölçeklenebilir İşlemcilerdeki Deep Learning Boost özelliği
Derin öğrenme, yoğun bir grafikle bağlanmış birçok bağımsız işleme birimi veya nöron içeren yapay nöral ağları kullanarak model geliştirme sürecidir. Nöral ağlar, her türlü verideki bilinmeyen veya önceden tahmin edilemeyen kalıpları tespit etmede etkileyici bir başarı sergilemiştir. Görüntü ve video tanıma ve çözümlemesinden ses ve dil dönüşümüne, zaman serisi verileri ve anormallik tespit çözümlemesine kadar birçok alanda uygulanmıştır.
Modern modeller geliştirmek için nöral ağlar kullanma süreci iki aşamaya ayrılmıştır: mevcut veriler kullanılarak nöral ağa kalıpları nasıl tespit edeceğinin öğretildiği eğitim ve eğitilen modelin yeni verilere maruz bırakılarak uygun kararları almasının beklendiği çıkarım. Nöral ağlar eğitme süreci yıllardır donanım ve yazılım alanındaki yeniliklerin odak noktası olmuş olsa da işletmelerin yapay zeka çabalarının karşılığını gördükleri alan çıkarımdır.
Çıkarımın eğitim sürecinden farklı donanım gereksinimleri bulunur. Eğitimde yarı duyarlıklı veya tek duyarlıklı kayan noktalı işlemler ve benzer verilerin büyük vektörlerinin aynı anda işlenebilmesi gerekir. Çıkarımda toplam hesap gereksinimleri daha azdır, çıkarım daha çok gecikme (karar verme süresi) odaklıdır ve 8 bit ile 16 bitlik tam sayılar gibi düşük duyarlıklı sayısal biçimlerden yararlanabilir.
2. Nesil Intel® Xeon® Ölçeklenebilir işlemci serisi ağırlıklı olarak Deep Learning Boost olarak bilinen tamamen yeni bir özellik yoluyla ikinci (çıkarım) aşamaya odaklanır. Intel® Deep Learning Boost, Xeon'un 512 bit genişliğindeki vektör birimlerine (AVX512) azaltılmış duyarlıklı işlemler (8 bit ve 16 bitlik tam sayılar) sağlar. Deep Learning Boost ile etkinleştirilen Intel® Xeon® işlemcileri tek bir donanım talimatında aynı anda 64 adet 8 bitlik tam sayıyı (veya 32 adet 16 bitlik tam sayıyı) işleme alabileceğinden bu durum azaltılmış duyarlıklı çıkarım için büyük bir kapasitedir! Bunu geniş düşük duyarlıklı vektörlerdeki Fused Multiply Add (FMA) gibi birleşik işlemleri gerçekleştirebilme becerisiyle birleştirince sistemin aktarım hızı önemli ölçüde artar.
Dell EMC, Intel® Deep Learning Boost'un nöral ağ çıkarımına sağlayabileceği uygulanabilir performans iyileştirmelerini karşılıklı testlerle incelemektedir. Yukarıdaki şekil, kuruluşunuzun 2. Nesil Intel® Xeon® Ölçeklenebilir işlemciler (Intel® Deep Learning Boost özellikli) kullanarak ne kadar gelişebileceğini göstermektedir. 1. Nesil Intel® Xeon® Ölçeklenebilir işlemciler ("Skylake" kod adlı), ResNET-50 çıkarım karşılaştırmasında tek duyarlıkta (FP32) saniyede 258 görüntüyü ve daha düşük 8 bit tam sayı duyarlığında saniyede 389 görüntüyü işleyebilirken Deep Learning Boost'un getirdiği yeni talimatlarla 2. Nesil Intel® Xeon® Ölçeklenebilir işlemciler, 8 bit tam sayı duyarlığında saniyede 1278 görüntüye kadar çıkarak üç kattan daha fazla işlem yapabilir!
Bu Neden Önemli?
Bu durum şirketiniz için ne anlama geliyor? Yapay zeka modelinizin yaptığı her çıkarım daha önceden elinizde olmayan bir sonuç veya karar verme önündeki engelleri yıkan otomatikleştirilmiş bir iş yüküdür. Bu sonuçların her biri, yani kaldırılan her engel; yeni bir satış, daha fazla yüksek fiyatlı ürün satışı veya daha hızlı yatırım kararına dönüşebilir. Bu da şirketinizin kasasına daha fazla para girişi demektir.
Şirketler dijital bir dönüşümden geçerken yapay zekayı ve özellikle de Derin Öğrenme'yi kullanmak, verilere dayalı bir dünyada rekabete devam edebilmeniz için çok önemlidir. Her ne kadar bu ilk aşamalarda yapay zeka modellerinin eğitimi odak noktasında olsa da işletmenizin yapay zekadan gerçekten yararlanabilmesini sağlayacak olan özellik çıkarımdır. Dell EMC PowerEdge sunucuları, gücünü 2. Nesil Intel® Xeon® Ölçeklenebilir işlemcilerden (Intel® Deep Learning Boost özellikli) alarak daha yüksek model çıkarımıyla yapay zekanın tam potansiyelini kullanarak işletmenize yardımcı olabilir. Daha yüksek performans, daha iyi bir işletme sağlar.