PowerMax: dertig jaar storage-innovatie met Symmetrix

Afgelopen april was het weer zo ver: Dell Technologies World! En zoals gebruikelijk ging dat gepaard met bekendmakingen van nieuwe producten. Dit jaar was het weer de beurt aan een Symmetrix om te stralen: de nieuwe PowerMax. Een all-flash array dat tot wel 10 miljoen IOPS kan leveren met constante sub milliseconde latency, tot wel 4PB opslag, en nog veel meer. Voordat we echter gaan beginnen met de nieuwe features, eerst een stukje geschiedenis van de Symmetrix, die toch aan de basis stond voor een groot deel van ons succes.

Weinig mensen weten dat EMC ooit begonnen is met de verkoop van kantoormeubilair. De oprichters, Richard Egan en Roger Marino, wilden graag voor zichzelf beginnen, en laten we eerlijk zijn, de opslag van papierwerk is gewoon een analoge vorm van data-opslag. De beide oprichters richtten toen hun pijlen op het produceren van memory boards voor IBM- en Prime-computers, maar wat EMC uiteindelijk groot maakte, was het Symmetrix-opslagsysteem. De Symmetrix is het geesteskind van de Israëlische ingenieur Moshe Yanai. Moshe was bij EMC gekomen in 1987, met het idee om een mainframe compatible (high-end) storage array te creëren. Toen was mainframe storage het domein van IBM, dit waren in feite losse schijven. Net als een mainframe waren de losse schijven ongelofelijk betrouwbaar, met een goede reden: mainframes werden en worden nog steeds gebruikt om de meest bedrijfskritische applicaties te draaien. Behalve betrouwbaarheid hadden ze ook een negatieve keerzijde: ze waren ook ontzettend duur!

Moshe geloofde dat je met goedkopere schijven en intelligente code, wat de data beschermde en beheerde, een efficiënter systeem kon maken. Erg onconventioneel voor die tijd, maar dat was Moshe ook. Opgegroeid in een kibboets, afgestudeerd aan de prestigieuze Technion universiteit in Israël, commandant van een artilleriegroep tijdens de Yom Kippur-oorlog. Al met al kon hij een kleurrijk CV voorleggen. Moshe’s filosofie was om dataverkeer in memory af te handelen. Memory was, en is nog steeds, vele malen sneller dan traditionele schijven. De eerste systemen gebruikten alleen de schijven in het geval van een stroomstoring, aangezien memory data niet vasthoudt zonder spanning. Waar de naam Symmetrix vandaan komt is niet helemaal duidelijk. Vermoedelijk vanwege de ingebouwde redundantie, waar je alle onderdelen in (symmetrische) paartjes bouwt.

Moshe heeft jaren aan de ontwikkeling van de Symmetrix gewerkt, met groot succes! EMC onder leiding van Joe Tucci sloeg echter een tweede pad in met de acquisitie van Data General en hun midrange storage systeem de Clariion. Moshe had zijn bedenkingen bij dit besluit en besloot EMC te verlaten. Zijn nalatenschap is echter nog springlevend.

High-end storage arrays noodzakelijk?
Wat is nu tegenwoordig nog de toegevoegde waarde van een high-end storage array? Is hardware niet commodity tegenwoordig? Kunnen we dit niet met software? High-end storage arrays zijn nog steeds nodig vanwege de compromisloze performance. Het zijn purpose built systemen om de meest bedrijfskritische applicaties te ondersteunen. Performance kunnen we op veel manieren krijgen. Met software defined storage bijvoorbeeld kunnen we ook extreem hoge performance creëren, maar er moeten dan vaak compromissen worden gemaakt. Denk aan gebrekkige data services, of verminderde uptime van het systeem. Compromisloze performance betekent volledige functionaliteit van het systeem en betrouwbaarheid te allen tijde. Betrouwbaarheid betekent dat alles dubbel is uitgevoerd, en bij verlies van een enkel component, verlies je geen performance. Voor de always-on enterprise is downtime of verlies van functionaliteit niet acceptabel.

Een high-end storage array wordt ook gekenmerkt door wat we noemen ‘data services’. Data services zijn softwarecomponenten om data sneller beschikbaar te maken, zoals het intelligent plaatsen van data waardoor bepaalde applicaties de best mogelijke performance krijgen. Wellicht de belangrijkste toepassing van data services is om data te beschermen. Tegen bijvoorbeeld logische corruptie – oftewel slijtage van de data wat het onleesbaar maakt- of het per ongeluk weggooien van belangrijke bestanden. Nog belangrijker is het beschermen tegen rampen. Tijdens de WTC-aanslag in ’93 kwamen er zes mensen om het leven. Dit staat In schril contrast met het aantal slachtoffers acht jaar later tijdens 9/11. Dat is niet het enige verschil. Hoewel het aantal slachtoffers in ‘93 “gering” was, was het verlies van data enorm! Bedrijven en organisaties waren plotsklap verdwenen omdat hun gehele IT was verwoest! Gelukkig hadden veel organisaties hiervan geleerd, en hun data op een tweede locatie ondergebracht toen de kapers zich met vliegtuigen in de Twin Towers boorden. Het repliceren van data is iets waar de high- end systemen in uitblinken. Door de enorme kracht kan het systeem dit doen zonder dat andere processen hieronder lijden.

Tegenwoordig is het niet alleen maar traditioneel wat de klok slaat. We zitten midden in een digitale revolutie. De workloads zijn niet meer alleen traditioneel. Applicaties als SAP of Oracle zijn klassieke voorbeelden van traditionele workloads. Organisaties maken steeds meer gebruik van analytics, vooral real time analytics. Real time analytics is extreem waardevol voor organisaties. Het live ontdekken van problemen in uw logistiek proces, of real time fraude detectie. Real time analytics vereist een hoop performance van een omgeving. Uw business leunt zwaar op die traditionele workloads, dus het gebruiken van die nieuwe moderne workloads voor bijvoorbeeld analytics, kan alleen zolang ze niet de business hinderen. Gelukkig hebben wij de oplossing.

De nieuwe PowerMax
Bijna 30 jaar na de ontwikkeling van de eerste Symmetrix, presenteren wij met trots de PowerMax. De bouwblokken waaruit een PowerMax is opgebouwd heten Powerbricks. Een Powerbrick heeft eigen controllers (directors) en opslag. De directors bevatten CPU’s, geheugen, front end- en back end-poorten, en directors werken onderling samen via een razendsnel Infiniband-netwerk. Verder heeft een PowerMax batterijen om het systeem tijdens een stroomstoring genoeg tijd te geven om kostbare data veilig weg te zetten. De Powermax lijkt erg op zijn voorganger, de VMAX, echter dat is meer cosmetisch. Om te beginnen wordt deduplicatie ondersteund. Deduplicatie slaat unieke blokken data maar een keer op. Samen met compressie, wat datablokken verkleint, levert de PowerMax een gemiddelde datareductie van 3:1. Deduplicatie werd vroeger vermeden vanwege de performance penalty, het inleveren van snelheid. De ontwikkelaars laten deduplicatie over aan aparte hardware modules op de engines, dit zorgt ervoor dat de CPU’s belast met het afhandelen van data, niet extra worden belast met het reduceren van de hoeveelheid data. Nou is deduplicatie niet revolutionair in een storage array, maar deduplicatie met nagenoeg geen performance penalty is wél revolutionair. Dankzij machine learning plaatst de PowerMax de meest gebruikte blokken (‘hot data’) op het snelste medium, op flash of SCM, meer over SCM later in dit blog. Wellicht het meest spannende van de PowerMax is de ondersteuning van NVMe. NVMe is een storage protocol zoals SAS, SATA of Fibre Channel. Het is een set van regels waar computersystemen zich aan houden om data te kunnen versturen en ontvangen. Wat NVMe bijzonder maakt is het feit dat het ontworpen is voor Flash-opslag en vele malen efficiënter is dan de genoemde protocollen. De schijven zijn solid state disks (SSD) en omdat het protocol minder overhead heeft, zijn de reactietijden vele malen korter. Veel van de ‘oudere’ protocollen zijn geschreven met mechanische schijven in het achterhoofd. Mechanische schijven zijn gevoeliger voor fouten, het protocol moest dus robuust genoeg zijn om die fouten te kunnen corrigeren. De hedendaagse schijven zijn minder vatbaar voor fouten, dus het werd tijd om het protocol te herzien.

Powermax

De PowerMax onderscheidt zich nog meer door het gebruik van dual-ported NVMe-schijven, het eerste storage array in de industrie die dit ondersteunt. De Symmetrix is van oudsher active-active. Dat betekent dat er via beide beschikbare kanalen op de NVMe schijf wordt gelezen en geschreven. Dus meer snelheid en redundantie ten opzichte van andere oplossingen die een active-passive opzet hebben. De nieuwe PowerMax is ook klaar voor NVMe over fabrics. Oftewel, NVMe van de host tot aan de storage array. En met klaar bedoelen we: één non-disruptive upgrade van de front end poorten, en je bent klaar. Op het moment van schrijven zijn er nagenoeg geen hosts die dit ondersteunen. De PowerMax is er echter klaar voor!

SCM, of storage class memory (Intel Optane), wordt gezien als de meest revolutionaire verandering in de storage industrie. SCM is snel,bijna 10 keer sneller dan een SSD! Waar standaard memory ‘volatile’ is, is SCM ‘non-volatile’. Volatile is afgeleid van het Latijnse woord ‘Volatilis’, wat onder andere betekent: vluchtig. Dat is meteen één van de cruciale kenmerken van standaard memory: data is aanwezig, zolang de storage van stroom wordt voorzien. Memory wordt ook gebruikt voor het tijdelijk opslaan van data vóór het opgeslagen wordt op schijven. Vergelijk het met het korte termijn geheugen, het is datgene wat we nu aan ons hoofd hebben, waar we nog geen lange termijn herinneringen van hebben gemaakt. Wat als we nu de snelheid van memory kunnen krijgen maar non-volatile? Dat kan nu met NVMe en SCM. De lezer met een sterk korte termijn geheugen herinnert zich Moshe’s filosofie nog: data wordt sneller afgehandeld in memory.

‘footprint’
Veel organisaties hebben ‘green IT’ hoog op de agenda staan. Hoe minder stroom een IT-omgeving verbruikt, hoe minder CO2 er wordt uitgestoten. SSD’s en SCM verbruiken een fractie van de stroom die een traditionele schijf verbruikt. De PowerMax heeft een ontzettende hoge dichtheid. In bepaalde gevallen vervangt een enkele PowerMax negen traditionele kabinetten. Dat scheelt niet alleen in het stroomverbruik, maar ook in datacenterruimte.

Data Services
Het snelste high-end storage array zou nergens zijn zonder de juiste Data Services. Voor de PowerMax zijn de meest gebruikte:

Met SnapVX kunnen organisaties snel en gemakkelijk snapshots maken van de meest kritische omgevingen. Logische corruptie of het per ongeluk verwijderen van data of bestanden zijn risico’s die grote gevolgen kunnen hebben. Dat is waar snapshots voor zijn bedoeld. Iedere schrijfactie zorgt ervoor dat het overgeschreven blok weg wordt gezet naar een andere plek in het array. Zodat we, indien gewenst, die originele blokken kunnen terughalen (rollback). Logische corruptie of verwijderen van data is ook een schrijfactie.

Appsync biedt integratie van SnapVX met applicaties als Oracle, SQLServer en Exchange, waardoor applicatiebeheerders controle krijgen over het creëren van snapshots op voor de applicatie zinvolle momenten (application consistent). Dat hoeft dus niet meer door de storage administrator gedaan worden.

Replicatie wordt uitgevoerd met SRDF (Symmetrix Remote Data Facility). SRDF is de gouden standaard voor replicatie software. SRDF is geïntroduceerd in 1990. Het stelt organisaties in staat om asynchroon en synchroon te repliceren. Synchroon voor korte afstand waarbij geen enkel blok aan data verloren raakt. Asynchroon wordt gebruikt voor de langere afstand, waarbij enkele blokken data verlies acceptabel is. SRDF Metro is wat we noemen active-active replicatie. In feite is het synchrone replicatie, echter in het geval van een storing of ramp gaat de overlevende kant door en vervangt automatisch de uitgevallen kant waardoor storage ononderbroken beschikbaar blijft voor de hosts . Dus zonder inmenging van uw IT specialisten. Te vaak zien we het nog gebeuren dat organisaties niet voorbereid zijn op een ramp. SRDF Metro is de ideale oplossing voor organisaties die zich zo min mogelijk downtime kunnen veroorloven.

Conclusie
De nieuwe PowerMax is de koning van de high-end storage arrays. We zijn niet de eerste in de industrie met een NVMe storage array, maar wel de meest volledige oplossing. Wat voor workloads uw organisatie ook genereert nu en in de toekomst, u bent er nu klaar voor met onze PowerMax.

Kijk voor meer info over PowerMax op dellemc.com/en-ie/storage/powermax.htm#collapse

SE Justin Rik, justin.rik@dell.com
SE Jan Sterk, jan.sterk@dell.com

About the Author: Justin Rik Jan Sterk