Hoe kan je besparen in de kosten voor dataopslag? Simpelweg: verwijderen. In iedere organisatie zijn er datagroepen die niet worden gebruikt. Deze staan jarenlang tussen databases, applicatieservers en fileservers opgeslagen. Dagelijks wordt de hoeveelheid inactieve data veiliggesteld door, al dan niet slimme, back-upvoorzieningen en in geval van een calamiteit worden deze inactieve data keurig teruggeplaatst. Geen medewerker die er actief iets mee doet, niemand die het weet en het kost dagelijks een deel van je ict-budget. De kosten zijn niet alleen de diskruimte, ook de back-up, energie, koeling en inspanning van beheer. De oplossing: verwijder deze data.
In dataclassificatieonderzoeken zien we regelmatig data opgeslagen op storagenetwerken die niet meer worden gebruikt. In extreme gevallen worden data al meer dan zes jaar niet meer gebruikt. Er is geen activiteit: data worden niet gecreëerd, bewerkt of gelezen. Als er nog kennis over de bron van deze 'spookdata' aanwezig is, blijkt dat van voor een fusie, herinrichting van afdelingen of grote projecten te zijn geweest. Deze data waren ooit van belang, zijn in de vergetelheid geraakt of al naar andere systemen gemigreerd.
Om te voorkomen dat hoge kosten worden gemaakt aan data die niet meer in gebruik zijn, zijn classificatie en meting van belang. In verschillende storagemanagementapplicaties zijn opties om datagebruik inzichtelijk te krijgen. Zijn dergelijke managementapplicaties niet aanwezig of is er nog geen voordeel te halen met dergelijke applicaties, dan kan door middel van dienstverlening een onderzoek worden gedaan. Deze aanpak geeft goed zicht op gebruik van data. Als deze kennis wordt gecombineerd met de waarde voor de organisatie van deze data ontstaat er een plan:
– Wat is van belang en wat niet?
– Welke data behoren tot de kern van de organisatie?
– Welke data zijn randfactoren?
– Op welke hoeveelheid data is een bewaarplicht van belang en wat houdt deze in?
Het is meestal niet de storagebeheerder of de verantwoordelijke voor de back-up/recovery die hier een antwoord op kan geven. Daarin schuilt dan ook gelijk een gevaar. Wie in de organisatie durft hier een antwoord op te geven? Het antwoord 'bewaar maar' of 'we kijken er later wel naar' is het duurste antwoord en gelijk de oorzaak van de grote omvang van data die niet meer worden gebruikt. Als het antwoord duidelijk is omdat er een bewaarplicht bestaat of dat ze voor bijvoorbeeld onderzoek moeten worden gebruikt, is het eenvoudig: de data blijven behouden.
Uit dataclassificatieonderzoeken blijkt tot nog toe dat het meevalt welke data echt bewaard dienen te blijven en ook voor hoe lang. Het besluit om data te verwijderen valt vooralsnog niet mee. Ik begrijp ook wel dat niet alle data na zeven jaar (op basis van belastingwetgeving, zonder verdere bewaarplicht zoals medische data, onderzoeksdata, media, etc.) zomaar verwijderd mogen worden. Gevoel, historie en cultuur kunnen bepalend zijn in de wens van een organisatie hoe met inactieve data om te gaan. Door een goed onderzoek en helderheid van eisen kunnen kosten worden bespaard door het verplaatsen van de data naar systemen die een lagere kostprijs en een lagere beheerinspanning hebben. Met aanvulling van duidelijke servicelevels over beheer en bewaren van data wordt de omvang van data beter en duidelijker te beheren én te beheersen. Ook de groei van data kan hiermee beter worden gefaciliteerd. Dat de omvang van data groeit, is een feit, echter, dat deze onbeheersbaar groeit is te voorkomen.