Werner Vogels, de technische topman van Amazon, die harde schijven de weg van tapes ziet gaan, heeft laatst opvallend opslagnieuws onthuld. Amazon brengt twee nieuwe clouddiensten, op hdd-basis.
Cto Werner Vogels van Amazon wist jaren terug al te melden dat de harde schijf tape achterna gaat. ‘Magnetische disks zijn het nieuwe tape’, verklaarde hij eind 2013 over de volgens hem krimpende rol van het veelgebruikte opslagmedium. Inmiddels lijkt de rest van de it-wereld de visie van Vogels te volgen. Afgelopen maand op de AWS Summit in Nieuwegein liet de cto echter een iets ander geluid horen.
Nog niet uitgedraaid
Ja, ssd’s zijn door hun lage latency en toenemende opslagcapaciteit nog altijd de toekomst voor serieuze en snelle gegevensopslag. Maar harde schijven zijn nog niet uitgedraaid. ‘Wat kunnen we doen, hoe kunnen we innoveren met magnetische disks?’, vroeg Vogels hardop in zijn openingspresentatie. Het antwoord had hij natuurlijk paraat, in de vorm van nieuw cloudaanbod dat Amazon biedt.
Hdd’s hebben twee belangrijke voordelen, somt hij op. ‘Ze zijn heel goedkoop en ze zijn heel goed in streamen.’ Laatstgenoemde slaat op sequentieel opgeslagen data, die dan block voor block weer wordt uitgelezen. Ssd’s lopen met random schrijf- en leessnelheden flink voor dankzij hun interne aard van geheugenchips in plaats van de ronddraaiende platters in hdd’s.
Dankzij big data
De trends van alsmaar groeiende dataverzameling (big data) en gedegen analyse daarvan (data analytics) hebben de behoefte aan opslagcapaciteit flink doen toenemen. Tegelijkertijd is er sterke groei in de behoefte aan snelle opslag, plus snelle toegang tot opgeslagen gegevens. Qua capaciteit lijken harde schijven voorlopig ongeslagen, hoewel de opslagruimte van ssd’s nog altijd groeit – tegen dalende prijzen. Qua snelheid winnen ssd’s het echter.
Amazon-cto Vogels voorziet nu nieuw nut voor hdd’s, juist dankzij analytics. De cloudfirma heeft twee nieuwe types cloudopslag geïntroduceerd in zijn EBS (Elastic Block Store) die bewust hdd’s gebruiken. Deze zijn goed voor analytics, verklaart de technische topman. Het diepgaand analyseren van grootschalige hoeveelheden informatie is namelijk ook een kwestie van datastreamen.
Drie fases van analytics
‘Veel nieuwkomers bij AWS [Amazon Web Services – red.] willen analytics doen.’ Daarbij spelen drie fases: de inname (ingest) van data, de opslag (store) ervan, en de analyse ervan. De derde fase kan eventueel ook het delen van gegevens met andere toepassingen of andere partijen omvatten. Gegevens die in de back-end netjes sequentieel worden opgeslagen op harde schijven zijn dan met een consistent prestatieniveau toegankelijk – tegen een relatief laag prijsniveau. ‘Vaak is er na ingest en store niet meteen analyse.’
Amazon biedt voor de eerste analytics-fase al diverse eigen oplossingen om data sneller te kunnen opnemen in zijn cloudsystemen. Vogels noemt de mogelijkheid van direct connect, waarbij ‘uploadende’ klanten niet langer hoeven te vertrouwen op de doorvoersnelheid van algemene internetverbindingen. In plaats daarvan regelt Amazon een zo direct mogelijke verbinding met de snelste toegang, vaak bij een datacenter.
Doos vol disks via de post
Voor datagrootgebruikers biedt Amazon nog een aparte oplossing: een kant-en-klare lokale opslagbox die dan per fysieke post ‘de cloud ingaat’. De stevig behuisde, beschermde en beveiligde databox Snowball laat klanten tot wel 1 Petabyte per week uploaden, in batches van 50of 80 petabyte per keer. De volledig verzegelde opslagappliance is standaard voorzien van encryptie en kan na data-overdracht een verzendlabel aanmaken op het ingeboude e-ink schermpje. Onderschat de bandbreedte van een ‘truck vol met tapes’ niet, haalt cto Vogels een uitspraak van de bekende computerwetenschapper professor Andrew Tanenbaum aan.
HDD’s gebruiken uiteindelijk dezelfde data lay-out als tape alleen dan herhaalbaar door niet een lint maar een schijf te gebruiken. En dat de technische topman van Amazon dit nu pas ontdekt geeft wel aan dat het data probleem te lang onderkent is. En waarom zou ik data analytics bij Amazon doen als we hier ‘uitwijkcentra’ hebben die ook allerlei oude tape technologie ondersteunen?
Ja, ja het busje komt zo…. ik roep natuurlijk maar wat maar het probleem is niet de data maar de data-layout welke de hype van digitale transformatie drijft.
Je moet je analyse doen zoals het je past en wat past bij de case.
Op ieder potje past een dekseltje. En er zijn wel meer uitdagingen dan de data-layout…