In welke mate je de komende vijf jaar als organisatie je content onder controle krijgt is het verschil tussen succes en falen. De hoeveelheid content explodeert, de groei is exponentieel. Kosten en risico’s van content groeien mee. Het is een chaos en niet meer onder controle.
Hierom is het onder controle brengen van deze chaos een van de meest waardevolle proposities van dit moment binnen ecm, zo niet de meest waardevolle. Niet alleen vanwege het beperken van de kosten en risico’s, maar ook vanuit het mogelijk maken de business te optimaliseren door weer de eigenlijke waarde van de content te kunnen verkrijgen. Alles drijft op content, deze optimaliseren is key.
Bezem door de kast
Zelf heb ik recentelijk ook getracht wat controle te krijgen over mijn content. Ik ben begonnen met opruimen. Ik had verschillende backups op externe discs, usb’s, een oude laptop, een dropboxaccount, een box account, mediacenter met vele foto’s, een aantal e-mailaccounts, veel sociale media met content, en waarschijnlijk vergeet ik nog wat. Mijn doel was alles op één plek onder te brengen, ergens in de cloud. Ik begon met alles te verzamelen en te bekijken wat ik nu eigenlijk allemaal had en hoe ik het zou willen bewaren.
Deze plotselinge behoefte werd wellicht gedreven door het feit dat ik er in mijn overleggen met klanten hier op wijs: hoeveel waarde het heeft eens goed de bezem door de contentkast te halen. Het is de eerste stap in het controle krijgen, en zoals ik in mijn opening aangaf, het is nu het moment om dit te doen. Wat ik al een uitdaging vond met mijn beperkte hoeveelheden, is een gigantische uitdaging voor vele verschillende stakeholders in grote organisaties.
Cio’s hebben onvoldoende inzicht in welke content waar staat, waar het voor gebruikt wordt, welke systemen er aan gelinkt zijn, welke kosten er aan verbonden zijn et cetera. De cfo’s zien dat it-budgetten blijven groeien en vooral de infra, storage en beheer componenten, meer dan de prijs hiervan naar beneden gaat. Privacy officers hebben geen inzicht in en controle over de gevoelige content, opgeslagen op de verschillende locaties in de organisatie. Dit alles leidt tot inefficiënte business en creëert een steeds grotere impact.
Niet opitmaal
Even terug naar mijn eigen opschoonactie. Het was geen leuk werk, en ik heb niet het idee dat het helemaal optimaal was. Wat ik vooral zelf ontbeerde was correct versiebeheer, metadatamodellen en richtlijnen, eigenlijk totaal geen informatiebeleid. Dus wellicht mis ik zaken waar ik nog achter ga komen, en heb ik zeker nog dubbele bestanden of niet geïdentificeerde versies. Het zou heerlijk zijn geweest een tool te hebben die me inzichten gaf in wat ik allemaal waar had staan. Ik koppel even mijn dropbox, box, mijn backups, mijn laptop en begin te analyseren. Ik zie snel hoeveel ik waar heb staan, ontdek dat ik foto’s meerdere keren heb opgeslagen, zie presentaties waarvan wel versies versies bestaan. Ik creëer regels om alleen de waardevolle content te behouden en zet het meteen over naar mijn target cloud omgeving. Het had erg prettig geweest, helaas was dit niet het geval.
Dat ik iets dergelijks niet kon vinden voor mijn eigen gebruik, betekent gelukkig niet dat dit ook nog niet voor je organisatie mogelijk is. De totale omgeving van ongestructureerde data kan via slimme technieken gebaseerd op natural language processing geclassificeerd worden. Met deze classificatie kan vervolgens via regels en filters bepaald worden welke actie op deze data van toepassing is. Wil je het niet meer bewaren omdat het een duplicaat is of te oud, in quarantaine zetten omdat je het niet zeker weet, migreren naar een andere omgeving, of extra beveiligde omgeving? De inzichten bieden vele mogelijkheden om je landschap te optimaliseren. Is het een risico dat een bepaald type informatie op een bepaalde locatie verblijft, met deze inzichten kun je bepalen het te verplaatsen. Samengevat levert de controle een aantal snelle voordelen op.
-
De eerste is puur kostenbesparing, minder kosten storage, infra, beheer, systemen omdat nu eenmaal minder content beheerd en beheerst dient te worden.
-
Ten tweede een grote optimalisatie van de business. Correcte zoekresultaten, minder logge content systemen, de juiste beslissingen nemen op basis van de juiste correcte content.
-
Ook maakt het mogelijk het risico op grote boetes door niet voldoen aan wet- en regelgeving of privacyzaken te verminderen. Inzicht in de gevoeligheden van je content kan gebruikt worden voor opzet beleid of mitigeren van risico’s
-
Verder kunnen door analyses en inzichten optimale migratiescenario’s, archiefinrichting, applicatie rationalisatiescenario’s bepaald worden. Leidend tot nog verdere besparingen en optimalisaties.
Het is tijd om de controle te pakken. De groei is exponentieel, de uitdagingen die dit oplevert ook. Wees niet te laat.
@Henri
Downplayen?
Sorry, maar U.S. geeft gewoon ruiterlijk toe dat ze ‘big data’ in de cloud gebruiken omdat ze schade aan economie door verlies IP en fraude op $300 miljard per jaar schatten. Laten we het ‘economic defense’ noemen en ik had je al gewezen op schrijven van de Amerikaanse variant van de Kamer van Koophandel hierover. Net als schrijven over Coud Data Management Initiative, leverancier onafhankelijk dus begin niet over een dubbele agenda.
Argumentatie over kostenverlaging lijkt me nogal discutabel als de kosten van opslag niet in rekening gebracht worden zoals ik al schreef in opinie ‘Help! De dokter verzuipt’ want goedkoper dan gratis kan niet. Weet 100% zeker dat Dropbox niet goedkoper is of geschikt voor dit soort data. Lees ook eens kritisch motivatie voor Localbox door want de signalen zijn niet te ontkennen.
Typisch dat jij dat telkens wel kunt als iemand wijst op verlies van soevereiniteit van de content annex data als je beheer ervan uitbesteed. Een slimme hybride data architectuur, waar de cloud deel uit van kan maken is niet alleen goedkoper dan al jouw oplossingen maar voldoet ook aan wetgeving rond opslag van gevoelige gegevens. Opslag gaat namelijk niet om de disk maar de continuïteit van de business.
Kortom, risico’s en de maatregelen daar tegen en zolang jij dat niet begrijpt blijven mijn opinies dus inderdaad obscuur. In tegenstelling tot jouw kan ik me wel vinden in artikel hoewel ik stel dat ongestructureerde data niet bestaat, er is alleen ongeclassificeerde data. Zo wordt technische metadata bijvoorbeeld gebruikt voor automatische storage tiering waarbij niet of nauwelijks gebruikte data naar minder snelle maar goedkope resources zakt.
Dus zullen we de rekensommetjes eens maken?
Ewout, door hoogwaardige diensten over het internet USB Sticks in de cloud te noemen ben je dat aan het downplayen. Daarnaast roep je niet tegen de cloud te zijn, maar onderbouw je dat zelden met voorbeelden. Je grijpt de NSA erbij wanneer het je uitkomt, maar privé blijf je gewoon een smartphone gebruiker met publieke email diensten erop. Zoals we onlang hebben geleerd vonden Europese landen en in ieder geval Duitsland het prima als de Amerikanen een handje helpen met data vergaren, dus wat maakt dat onze overheden beter dan Amerikaanse? Zij ontkennen het tenminste niet meer en dat is al een stap verder 🙂
Als we dan naar Compliance en regelgeving kijken en de wet, dan zie je dat het voor het gros van de bedrijven en het overgrote deel van de data niet bijzonder moeilijk is om gebruik te maken van cloud computing en je aan regelgeving en de wet te conformeren.
Tel daarbij op dat zeer veel van de bedrijven ook daadwerkelijk interesse heeft om meer met cloud computing te doen en als je dan kijkt naar opslag en alles wat daarmee mogelijk is (Auditing, Governance) en de prijs -ik heb het *niet* over de gratis varianten- dan is dit een zeer krachtige propositie. Als een Petabyte 5 miljoen per jaar moet kosten, dan lijkt cloud computing inderdaad een interessant fenomeen om te onderzoeken.
Wat betreft on topic:
In een tijd waarmee we samenwerken, data vaak ook op externe systemen staat en zeer veel kanalen zijn, lijkt mij een technische oplossing voor je ECM problemen zoeken niet de juiste manier. Ideeën en beleid gaan in mijn ogen voor technische oplossingen. Classificatie moet in mijn ogen vooral plaatsvinden door de content maker. Die stelt zichzelf de vraag “Wat doe ik nu? En wat kan dit betekenen voor de organisatie?”.
Het is dus meer een kennis gebrek en lacune in de regie, dan dat je dit technisch wilt classificeren en daarmee het opslag medium en locatie bepaal.
Een punt, het gaat steeds over content en dat vind ik toch verwarrend. Bij content denk ik aan al het materiaal wat bijvoorbeeld via websites aangeboden wordt, een website heeft content. Een krant biedt content, de tv biedt content. Het slaat op inhoud. Data lijkt me dan een betere term. Wel eens met de schrijver, het is moeilijk om het overzicht te behouden.
@Sjoerd
Denk dat je de lezers op het verkeerde been hebt gezet om je originele verhaal te algemeen op te schrijven. Ook op mij kwam het over als een reclame stukje gecombineerd met zakelijk ingestelde bangmakerij. Je toelichting schaft wat dat betreft nodige verheldering.
@Henri
Als je 5 PB aan bedrijfsgegevens in de cloud hebt dan zou je weleens net als alle klanten van Nirvanix, Exacthost enzovoort verrast kunnen worden in de continuïteit van je bedrijfsvoering als leverancier de stekker er plotseling uittrekt. Lees wat dat betreft nog eens heel rustig mijn opinie WA-verzekering in de cloud terug. Met name Storage as a Service is een economische varkenscyclus en er zit wat mij betreft een verschil tussen de hoogwaardige diensten en de oplossingen voor consumenten zoals de door jouw genoemde oplossingen e.d. En die mening is volgens mij nu ook de overheid toegedaan als ik kijk naar de behoefte aan GemCloud, Localbox etc.
Betreffende je opmerking over classificeren vooraf lijkt het erop dat je mij langzaam gelijk gaat geven, helaas zit je nog teveel aan de kant van de suzereiniteit door met productized oplossingen te komen maar het is inderdaad een stapje verder. Voor wat beteft compliance in de cloud ga ik je vast nog wel het vuur aan de schenen leggen op Ngi-NGN cloud congres 6 november in Bunnik;-)