Hoewel veel bedrijven denken met ssd’s beter af te zijn dan met hdd’s, zijn de solid state drives niet veiliger als het gaat om dataverlies. Sterker nog, data recovery op ssd’s kent de nodige uitdagingen.
Ssd’s bieden bedrijven een korte zoek- en toegangstijd en doordat ze geen bewegende delen bevatten, zijn ze zeer geschikt voor gebruik in mobiele apparatuur. Het is aanlokkelijk om te denken dat data veiliger is op een solid state drive, maar in de praktijk hebben we daar nog geen bewijs voor kunnen vinden.
Ssc´s zijn onder te verdelen in ´single-level-cell’ (slc) en ‘multi-level-cell’ (mlc). Bij slc wordt data in één bit per cel opgeslagen, bij mlc kunnen meerdere bits per cel worden opgeslagen. Hierdoor zijn slc-ssd’s betrouwbaarder, duurzamer en sneller. Mlc-schijven kunnen data significant compacter opslaan. Maar daardoor zijn ze wel gevoeliger voor dataverlies. Daarbij is de levensduur van een solid state drive afhankelijk van het aantal schrijfbewegingen dat wordt gemaakt. Hoe vaker data wordt weggeschreven, hoe minder lang de schijf meegaat.
Dat veel mensen zich dit niet realiseren, blijkt uit onderzoek dat wij hebben gedaan hiernaar. Ruim 70 procent van de ondervraagden is van mening dat de levensduur van ssd’s niet verschilt van die van hdd’s. Ook als de schijf lange tijd zonder netspanning zit, kan data verloren gaan. Dat is bij hdd’s niet het geval. Hier gaf 77 procent van de respondenten aan dat ze dachten dat het risico op dataverlies niet verschilt tussen ssd’s en hdd’s.
Algoritmes achterhalen
Besturingssystemen kunnen prima vanaf ssd’s worden gestart, gebruikers roemen de snelheid waarmee systemen opstarten in die gevallen. Voor structurele data-opslag adviseer ik nog steeds hdd’s aan. Die missen de snelheid van ssd’s en zijn kwetsbaarder doordat ze bewegende onderdelen bevatten, maar zijn minder gevoelig voor dataverlies, omdat de succesratio van data recovery op hdd’s hoger is dan op ssd’s.
Dat komt door de manier waarop solid state drives zijn opgebouwd. Bij ssd’s wordt de allocatie van gegevens geregeld door de stuurchip, dat gebeurt dynamisch. Als die chip kapot is, vinden we op de diverse geheugenchips op de ssd heel veel fragmenten van dezelfde bestanden. Maar doordat we het algoritme op de stuurchip niet meer kunnen lezen, weten we niet hoe al die fragmenten samengevoegd moeten worden tot het originele document. Je kan het vergelijken met een raid-recovery.
Fabrikanten zijn er niet happig op om hun algoritmes te delen, dus vaak moeten we dat zelf achterhalen. Dat levert een hoop gepuzzel op in onze labs. Als we geen algoritmes beschikbaar hebben van de fabrikant, dan moeten we uit de raw-data die we van de geheugenchips afhalen en op basis van de kennis van de opbouw van bestanden en diverse aangetroffen fragmenten terug gaan redeneren. Dat is ware cryptografie.
Dataverlies voorkomen
Maak geen gebruik van de ‘on-board’ encryptie van een ssd, maar gebruik software-encryptie. Daarmee kunnen we software-keys gebruiken om patronen te herkennen in het geval van een data recovery, als de encryptie in de hardware zit, kan dat niet. In dat geval wordt het terughalen van gegevens een complexe en tijdrovende zaak. Andere tips om de kans op een succesvolle recovery van een solid state drive te vergroten zijn het onder spanning houden van de de ssd en het op tijd vervangen van de schijven. Zeker als er veel schrijfbewegingen worden gemaakt, weet je dat de levensduur beperkt wordt. Daar kun je op inspringen door de hardware tijdig te vervangen. Maar het belangrijkste blijft nog altijd een gedegen back-up, of een bedrijf nou werkt met hdd of ssd.
Data erasure
Oude opslagmedia die vervangen wordt, moet op een gedegen manier worden vernietigd, zodat de data die ooit op de schijf stond, niet meer terug te halen is, ook niet door een data recovery bedrijf. Voor ssd’s ligt daar nog een uitdaging, want software voor data wissen van ssd’s is nog niet beschikbaar. Voor normale harde schijven is éénn keer volledig overschrijven voldoende. Voor ssd’s adviseren we om het medium minimaal tien keer te overschrijven, maar door de opbouw van ssd’s weet je nooit zeker of alles ook daadwerkelijk overschreven wordt. Als een bepaald blok op een ssd wordt gemarkeerd als ‘bad’ of ‘fawlty’, is dat blok niet meer toegankelijk. Overschrijven is dan niet mogelijk. Het enige dat vooralsnog werkt als data wissen van ssd’s is het fysiek vernietigen van de chips.
Jaap Jan,
Op zich opmerkelijke cijfers aangezien algemeen bekend en bewezen is dat de MTBF van een SSD beter is dan die van een reguliere HD.
Echter moet je SSD natuurlijk wel goed inzetten. Voor reads is SSD top en bij writes is dit minder. Dit heeft ook zeker invloed op de levensduur. Technologieen zoals automatic storage tiering of ssd accelaratie dragen hier positief aan bij.
Je laatste alinea vind ik erg goed. Waar voor dank. Dit is zeker een weetje wat nog te vaak wordt vergeten.
Is het onderzoek nog online terug te vinden?
Uit het artikel: ….Voor normale harde schijven is één keer volledig overschrijven voldoende…
helaas, zou het toch naar 10 keer doen, NSA zal je dankbaar zijn als het 1 keer is….
Ik kan het toch niet laten. Hierbij even wat meer uitleg over de levensduur van Flash.
Van belang bij de Flash zijn de PE Cycle ( program-erase cycle ) en MTBF ( Meantime between failure )
Wat valt er onder een PE Cycle:
Reads = Geen PE Cycle
Writing = PE Cycle
Deleting = PE Cycle
Vergelijk appels met appels. Er zijn te veel verschillende smaken flash op de markt die het er niet overzichtelijker maken. Probeer daarom appels met appels te vergelijken. E-MLC / SLC zie je terug in de enterprise oplossingen en On chip flash en MLC zijn leuk voor thuis.
Praktijkvoorbeelden max PE Cycles (PE Cycle = solid-state-storage program-erase cycle ):
On chip flash = 100
MLC = 1500 tot 10.000 ( zeer veel differentatie / verschilt per leverancier/type )
E-MLC = 30.000
SLC = 100.000
Alles gaat op basis van PE Cycles per block. Dat laatste is van groot belang. En geeft vaak een vertekend beeld.
Meantime between failure. Ook dit verschilt per type HD en SSD. Onderstaand heb ik de praktijkvoorbeelden weergegeven:
MTBF
HD = 500.000 / 750.000
SSD = 1.500.000 tot 2.000.000
Net als bij de gewone HD’s is het in de enterprise storage oplossingen aan te raden om gebruik te maken van RAID. Ondanks er in flash geen rond draaiende componenten zitten gaat ook flash opslag een keer stuk.
@Ruud,
mooie berekening, 🙂
rest alleen nog de juiste RAID keuze,…… en (automatische) monitoring ……
Ter aanvulling op de andere reageerders.
Het hoofdonderwerp is dat de succesratio van data recovery op HDD’s groter is dan op SSD’s. Dat is ook mijn persoonlijke ervaring. Kan iemand dit aan de hand van onderzoek tegenspreken?
Ten aanzien van de mogelijkheid van dataverlies moeten ook de volgende punten meegenomen worden:
De verschillen in kwaliteit zijn groot, zoals Ruud al aangeeft. Maar de MTBF is niet elk jaar even groot. Belangrijker is de AFR (annual failure rate). Je wilt de AFR’s kennen voor de productieperiode. Helaas zijn bij nieuwe producten de MTBF en de AFR slechts schattingen, waarbij vooral die van de SSD’s uit de duim van marketing afdelingen gezogen zijn.
De capaciteit van SSD’s is kleiner dan van HDD’s, dus je hebt al gauw meer SSD’s nodig dan HDD’s. Als je twee of vier keer zo veel SSD’s nodig hebt voor de benodigde capaciteit, dan kunnen HDD’s veiliger zijn. Er zijn tenslotte HDD’s met een geschatte MTBF van pakweg 1.500.000 uur.