We maken ons er allemaal schuldig aan. Maar ict'ers klagen er steen en been over. Al die data, die maar lukraak opgeslagen wordt. Al die opslag, die de klauwen uit loopt. Maar nogmaals: we doen het allemaal. Van alles opslaan; meerdere versies, op meerdere plaatsen.
Voorbeeld: een bedrijf waar een vriend van me werkte. Daar stonden jaren geleden bestandsservertjes per afdeling, elk met eigen tape-backup ingebouwd. Het vollopen van die tape gebeurde volautomatisch. Zeg maar zeer automatisch, want de tape-capaciteit was op gegeven moment niet meer afdoende voor het wekelijkse productiewerk. Daarnaast was sommige data, steeds meer overigens, nog nodig voor een volgende productieronde. Dus moest beschikbaar (online) blijven.
Enkele jaren meekunnen
Op hoger ict-niveau was er al een tijdje onvrede over de gedistribueerde bestandsservertjes met dito backup. Het opslagprobleem, wat vast ook bij andere afdelingen speelde, was simpelweg nog een aanleiding om actie te ondernemen. Dus werd er een inventaris gemaakt en een prognose op basis van de datagroei van de afgelopen paar jaar. Vervolgens even ‘rondshoppen' en een storage solution kiezen.
Een fraaie, grote EMC-bak vol harde schijven werd op een mooi weekend naar binnen gereden, geconfigureerd en geactiveerd. Zo, dat was voortaan de centrale opslag, met een eigen – ook centrale – backup. Elke afdeling had ineens enkele Gigabytes ter beschikking. Dit moest wel enkele jaren mee kunnen. (Ja, dit is een verhaal uit de oude doos.)
Binnen twee weken vol
Helaas, binnen twee weken was de fonkelnieuwe opslagdoos vol. Echt vol, dus inclusief het bijschalen na de eerste alarmmeldingen over het vollopen van de afdelings-volumes. Bijna elke werknemer bleek namelijk de eigen c- of d-schijf al jaren gevuld te hebben met data, voor het werk, die nu prima – en handig – centraal kon staan. Ai.
Tuurlijk, daar zat ook niet-werkdata bij. Maar zelfs na aftrek daarvan, bleek de benodigde en gebruikte opslag veel groter dan wat was gedacht. Een flink budgetprobleem dus. Wat op te lossen viel door meer opslag (dus budget) of beter beheer (dus budget). Of een mailtje aan allen dat ieder niet zomaar alles moet opslaan. Want daar houden we ons allemaal netjes aan. Toch?
Opgeslagen informatie kan zeer sterk gecomprimeerd worden met bijvoorbeeld een entropy coder. Als dit gecombineerd wordt met een bewijsbaar veilige encryptie methode zoals een homophonic arithmetic coder, kan dit gecombineerd worden tot een prima oplossing voor dit probleem. Een uitleg van een operationeel (research) systeem kan gevonden worden op de URL http://picasaweb.google.com/freemovequantumexchange.
Het probleem is niet de data, maar de gebruiker. Informatie begint met gegevens en die horen ook bij het vak. Dat veel gebruikers niettemin dit allemaal zelf willen of kunnen doen is prima, maar dat heeft niets met informatica van doen. Ook niet iedereen is een beroepsfotograaf, ook al maakt hij of zij kiekjes.
ook het feit dat we uitgaan van pc’s en niet van werkstations met daarop de slechts denkbare software van Microsoft (pleonasme) vergroot het probleem.
Remedie: laat dit over aan vaklui op centrale servers met goede applicaties. En laat de gebruikers hun eigen data thuis opslaan.