Superpočítače se neustále vyvíjí a s tím i pracovní zatížení. Jak se sady dat zvětšují a stávají se složitějšími, úlohy umělé inteligence, jako je například hluboké učení, se stávají ústředním bodem. Stále více úloh hlubokého učení nyní běží na výkonných, škálovatelných a nízkolatentních systémech HPC. Ty jsou dnes schopné řešit problémy, které by před deseti lety byly zcela nemyslitelné. Tradiční úlohy HPC v oblasti přírodních věd, digitální výroby, ropného a plynárenského průmyslu, financí a podobných jsou schopny díky technologii hlubokého učení získat z dat ještě relevantnější informace za kratší dobu a s větší přesností. Společnost Intel si uvědomuje, že metody umělé inteligence jsou nyní klíčovými součástmi úloh HPC. Společnost Intel se za účely školení a, co je důležitější, zrychlení rozhodování modelů umělé inteligence rozhodla tyto úlohy postavit do středu zájmu díky nové 2.. generaci škálovatelných procesorů řady Intel® Xeon®.
2.. generace škálovatelných procesorů Intel® Xeon®
2.. generace škálovatelných procesorů Intel® Xeon® přináší celou řadu nových a vylepšených možností. Mezi nimi je možnost nasazení trvalé paměti Intel® Optane™ DC, lepší rychlosti technologie DRAM, lepší schopnost zpracování tradičních sad instrukcí, jako je jednotka FP32 s jednoduchou přesností, a nové možnosti zpracování pro úlohy hlubokého učení s novou sadou instrukcí Intel® Deep Learning Boost.
Technologie Deep Learning Boost ve 2.. generace škálovatelných procesorů Intel® Xeon®
Hluboké učení je proces vyvíjení modelů pomocí umělých neuronových sítí, které se skládají z mnoha nezávislých jednotek zpracování nebo neuronů spojených v hustém grafu. Neuronové sítě prokázaly obdivuhodnou schopnost rozpoznat neznámé nebo nepředvídané vzory ve všech typech dat a byly aplikovány na domény od rozpoznání a analýzy obrazu a videa přes transformaci zvuku a jazyka až po analýzu detekce anomálií a dat časových řad.
Proces využívání neuronových sítí pro vývoj špičkových modelů se dělí na dvě fáze: Školení, při kterém se používají stávající data k učení neuronové sítě, jak identifikovat vzory, a odvozování, při kterém je proškolený model vystaven novým datům a očekává se od něj, že bude provádět příslušná rozhodnutí. A přestože je proces školení neuronových sítí středem zájmu inovací hardwaru a softwaru již několik let, firmy zúročují svou snahu v oblasti umělé inteligence až ve fázi odvozování.
Odvozování klade jiné požadavky na hardware než školení. Školení vyžaduje aritmetické operace s plovoucí desetinnou čárkou s poloviční nebo s jednoduchou přesností a schopnost zpracovat současně mnoho velkých vektorů s podobnými daty. Odvozování klade mnohem nižší celkové požadavky na výpočet dat, výrazně se zaměřuje na latenci (rozhodnutí týkající se času) a může využívat výhod numerických formátů s nízkou přesností, jako jsou 8bitová a 16bitová celá čísla.
2.. generace řady škálovatelných procesorů Intel® Xeon® se zaměřuje hlavně na tuto druhou fázi (odvozování) s úplně novou funkcí, která se označuje jako Deep Learning Boost. Technologie Deep Learning Boost společnosti Intel® přináší na 512bitové vektorové jednotky Xeon (AVX512) aritmetické operace se sníženou přesností (8 a 16bitová celá čísla). Jedná se o velmi užitečnou schopnost pro odvozování se sníženou přesností, jelikož procesory Intel® Xeon® s podporou technologie Deep Learning Boost mohou současně zpracovávat 64 8bitových celých čísel (nebo 32 16bitových celých čísel) v jedné hardwarové instrukci! Spojte tuto schopnost s možností provádět sloučené operace, jako je FMA (Fused Multilate Add) u těchto širokých vektorů s nízkou přesností, a propustnost systému výrazně vzroste.
Společnost Dell EMC testuje uskutečnitelná vylepšení výkonu, díky kterým může technologie Intel® Deep Learning Boost provádět odvozování neuronové sítě. Výše uvedený obrázek ukazuje, jakého zlepšení může vaše organizace dosáhnout nasazením 2.. generace škálovatelných procesorů Intel® Xeon® s technologií Intel® Deep Learning Boost. Zatímco 1.. generace škálovatelných procesorů Intel® Xeon® (označovaná jako „Skylake“) je schopna zpracovat 258 snímků za sekundu v testu odvozování ResNet-50 s jednoduchou přesností (FP32) a 389 snímků za sekundu při snížené přesnosti 8-bitového celého čísla. Díky novým instrukcím, které technologie Deep Learning Boost přináší ve 2.. generaci škálovatelných procesorů Intel® Xeon®, je možné dosáhnout více než trojnásobné propustnosti při přesnosti 8bitových celých čísel na 1 278 obrazů za sekundu!
Proč na tom záleží
Co to znamená pro vaši společnost? Každé odvození, které model umělé inteligence provede, představuje informace, které jste předtím neměli, nebo automatickou úlohu, která odstraňuje překážky při rozhodování. Každá z těchto informací nebo z odstraněných bariér může vést k novému prodeji, dalšímu zvýšení prodeje nebo k rychlejšímu rozhodnutí o investicích. Tedy peníze, které jdou do kapsy vaší společnosti.
Vzhledem k tomu, že společnosti prochází digitální transformací, bude pro zachování konkurenceschopnosti v datově řízeném světě klíčové používat nástroje umělé inteligence – zejména hluboké učení. I když v této rané fázi byl důraz kladen především na školení modelů umělé inteligence, firmy budou skutečně využívat výhod umělé inteligence až díky fázi odvozování. Servery Dell EMC PowerEdge vybavené 2.. generací škálovatelných procesorů Intel® Xeon® s technologií Intel® Deep Learning Boost mohou vaší firmě pomoci využít plný potenciál umělé inteligence díky odvození vyššího výkonu modelu. Vyšší výkon pak znamená lepší podnikání.