De ontwikkelingen in de dataopslagindustrie gingen in 2011 volgden elkaar in rap tempo op. Zo nam de vraag naar ssd's toe en komt cloudstorage steeds meer in trek. Computable bepaalde aan de hand van het nieuws van 2011 tien trends en ontwikkelingen voor 2012 die een grote rol in de storagemarkt gaan spelen.
SSD's
De vraag naar solid-state drives (ssd's) voor grootzakelijke opslagsystemen neemt toe nu de prijzen daarvan verder zakken. Zo zijn bijvoorbeeld multi-layer cell (mlc) ssd's aantrekkelijker geprijsd. Mlc ssd's zijn in trek voor een hoge beschikbaarheid van applicaties. Door het tekort aan harde schijven zijn bedrijven sneller geneigd ssd's in te zetten voor hun grote dataopslagsystemen. Het tekort aan harde schijven, veroorzaakt door de overstromingen in Thailand, stabiliseert. Langzamerhand worden de fabrieken die de harde schijven maken weer geopend, zoals die van Western Digital en Seagate. Maar ssd's staan op de kaart en ze worden steeds sneller. Ook zullen er meer overnames in ssd-industrie plaatsvinden. Zo kocht Apple eind 2011 de Israëlische flash ssd-specialist Anobit.
Virtualisatie
Dataopslagomgevingen zullen vaker gebruikmaken van virtualisatiesoftware. Zo biedt VMware zijn vSphere 5 dataopslagbeheeroplossing voor virtuele omgevingen. Verder worden steeds meer systemen geschikt gemaakt en partnerprogramma's opgezet voor Microsoft Hyper-V. Dataopslagbeheerders kunnen zo beter een back-up van een virtuele machine (vm) maken of een virtuele desktop infrastructuur (vdi) optimaliseren.
Deduplicatie en thin provisioning
In 2012 wordt de datacompressietechnologie deduplicatie en thin provisioning vaker in gebruik genomen. EMC, Dell en HP hebben allemaal hun eigen oplossingen. Deduplicatie is interessant in virtuele omgevingen en arrays met ssd's. Door deduplicatie en thin provisioning toe te passen, hoeven it-afdelingen minder harde schijven aan te schaffen.
Tape
In 2011 werd tape op de korrel genomen. Toch zijn er nog steeds voorstanders van tape, zoals IBM en Oracle. In 2012 wordt er weliswaar meer data opgeslagen op harde schijven en de cloud, maar voor archivering blijft tape een prima oplossing. Tape blijft zich vernieuwen, bijvoorbeeld de linear tape file system (ltfs). Met ltfs wordt het mogelijk om een lto-tape rechtstreeks vanuit de Windows Verkenner, Linux of Mac Finder te gebruiken als een standaard harde schijf. Tapes worden hierdoor eenvoudig uitleesbaar op iedere andere lto-5 drive en andersom.
Big data en Hadoop
Big data wordt vaker omarmd in 2012 en wordt een onderdeel van het bedrijfsproces. Bij Big data wordt petabytes aan data verzamelt, opgeslagen en real-time geanalyseerd. Bedrijven kunnen hierdoor meer kennis opdoen van hun klanten. Veel grote storageleveranciers maken hierbij gebruik van het open source Hadoop-project. Onder andere Terradata, IBM, NetApp en EMC. Hadoop is een op MapReduce geïnspireerd open source Java-framework voor de bouw van data-intensieve gedistribueerde applicaties. MapReduce is een door Google geïntroduceerd framework voor het in korte tijd uitvoeren van berekeningen over heel grote hoeveelheden data van vaak meerdere petabytes. Met MapReduce kan in korte tijd veel data worden verwerkt doordat het een grote taak opsplitst in deeltaken. Die deeltaken worden over meerdere computers verdeeld. De computers voeren vervolgens de deeltaken gelijktijdig uit (distributie). Dit via de functies map en fold (reduce), die bekend zijn uit de functionele programmeertalen. Als een van de computers het begeeft tijdens het uitvoeren van zijn deeltaak, dan wordt die deeltaak automatisch door een andere computer overgenomen. Dit maakt het systeem zeer robuust.
Cloudstorage
Steeds meer bedrijven kiezen voor cloudstorage als alternatief voor of toevoeging op hun bestaande on-premise dataopslagomgevingen. Zo wordt de rol van publieke cloudserviceproviders groter. Zij bieden clouddiensten voor het opslaan, beschermen en analyseren van data. Denk bijvoorbeeld aan archivering, discovery en business intelligence in combinatie met big data-toepassingen.
Back-up
Het beschermen van data met een back-up blijft een belangrijk onderdeel van dataopslag. In 2012 worden vaker specialistische back-upleverancier overgenomen. Er is in ieder geval aanbod, zoals van CommVault Systems, Quantum, Veeam en ExaGrid Systems. Zij zijn goed voor back-up in virtuele omgevingen en in de cloud. Verwacht meer back-ups in de cloud door het groeiend gebruik van de notebooks, tablets en smartphones. HP, Microsoft en Apple hebben al een back-up gebaseerde clouddienst, zoals Apple iCloud.
Dell
Dell heeft de afgelopen jaren veel dataopslagtechnologie in huis gehaald. Bijvoorbeeld san-technologie van Compellent en nas-oplossingen van Exanet. De overnames moeten van Dell een sterke speler maken in de dataopslagmarkt, nu er afscheid is genomen van het samenwerkingsverband met EMC dat ruim tien jaar heeft geduurd. Om Europese ict-beslissers van zijn dataopslagportfolio te overtuigen, organiseert Dell in 2012 voor het eerst een driedaags Storage Forum in Londen.
EMC
EMC-baas Joe Tucci gaat eind 2012 met pensioen. Zijn opvolgers staan klaar. Het lijkt erop dat voorzitter en coo Pat Gelsinger, die eerder bij Intel bij Intel werkte, de opvolger wordt. Zo gaven Gelsinger en Tucci samen een langdurige keynote op de jaarlijkse conferentie Oracle World in San Francisco voor ruim 45.000 ict-beslissers. Gelsinger stond in 2011 prominent op het podium tijdens de EMC World- en VMworld-conferenties in Las Vegas.
NetApp
Dataopslagleverancier NetApp heeft veel succesvolle jaren achter de rug. Samen met EMC is het één van de best presterende ‘pure' dataopslagleveranciers. Maar de laatste twee kwartalen van 2011 voldeden niet aan de verwachtingen van analisten. Om het tij te keren moet NetApp nog nauwer samenwerken met zijn partners als IBM, Cisco en Oracle. Een andere optie is om andere storageleveranciers over te nemen. Of NetApp wordt overgenomen door een kapitaalkrachtige leverancier, zoals IBM. De exportcontrole van NetApp vergt een optimalisatie. De Syrische president en dictator Assad wist in 2011 nieuwe NetApp-storage aan te schaffen om internetgegevens van Syrische burgers op te slaan en te analyseren. Een aantal Amerikaanse senatoren waren hierover ‘not amsued'.
Deduplicatie is interessant in virtuele omgevingen en arrays met ssd’s
Wat een complete onzin. SSD’s worden over het algemeen gebruikt voor storage tiering. Deduplicatie kan in de meeste gevallen wel wat opleveren, afhankelijk van de applicaties die gebruikt worden.
Bijzonder er technologien van veel verschillende storage leveranciers worden uitgelicht, ik mis hier echter de ontwikkelingen bij een van de grootste vendoren; NetApp. Zij hebben in 2011 de grootste technologie update gedaan in hun historie en zijn nog steeds het enige storage merk die deduplicatie (en compressie) kunnen bieden op zowel primaire als secundaire storage systemen. Ben nog steeds een zeer tevreden gebruiker!
Dedupe maakt heel veel uit voor VM storage en voor VDI. De kosten per Gig gaan daarmee faktor 10 of meer omlaag.
De prijs van SSD storage is nog wat hoger momenteel dan drive based storage.
Met name is de inline dedupe faktor dus voor kostbare SSD storage van economisch belang
Inline deduplicatie en compressie is voor SSD systemen een must om het prijsverschil te compenseren. Traditonele leveranciers gebruiken SSDs inderdaad vooral om (automatische) Tiered storage aan te bieden maar dat is niet efficient of praktisch.
Gelukkig dedupliceren virtuele omgevingen uitstekend, omdat de blokken van besturingsystemen en softwarepakketten identiek zijn.
Nieuwkomers op de storage-markt zijn veel beter in staat om nieuwe technieken in hun producten te integreren en SSD’s op een veel slimmere manier in te zetten. (ZFS met meta-data op SSDs bijvoorbeeld.)
De vragen zijn juist:
– wanneer zijn SSD’s prijs-concurrerend met Harddisks (ik schat nog zeker 3 tot 5 jaar weg)
– wat doe je in de tussentijd om voldoende performance aan te bieden (IOPS, doorvoersnelheid)
– welke leveranciers zijn in staat om die performance tegen een goede prijs aan te bieden. Hint: de traditionele leveranciers kunnen dat nu in ieder geval nog niet…