Er komt heel wat informatie binnen en er gaat ook heel wat informatie naar buiten in een bedrijf. Niet alles is even nuttig en niet alles is even belangrijk. Een gestructureerde en georganiseerde aanpak van al die informatie is belangrijk. Het verhoogt immers de productiviteit en efficiëntie. Maar hoe beheren en beheersen we al die informatie?
Informatie is een nogal vrijblijvend woord. Het omvat immers zowel oninteressante reclame als bijvoorbeeld heel belangrijke facturen. Vandaar dat we liever spreken over informatiestromen. Die bestaan uit zowel fysieke als virtuele informatie. Fysieke informatie is alles wat op papier staat. Virtuele is alles wat alleen in de informaticawereld bestaat: webpagina's, e-mails, databasegegevens, opgeslagen documenten, noem maar op. De meeste bedrijven en organisaties hebben, zeker als ze kleiner zijn, gescheiden verwerkingssystemen voor beide soorten informatie. In kleine bedrijven is vaak goed geregeld wat er moet gebeuren met fysieke informatie, maar is er dikwijls niets voorzien voor de virtuele informatie. In grote bedrijven is de hoeveelheid informatie soms zo massief, zowel fysiek als virtueel, dat een globaal informatieverwerkingssysteem onvermijdelijk is. Als het organisatorisch veel beter is dat alles in eenzelfde omgeving belandt, maken grote bedrijven van fysieke informatie virtuele. Ze digitaliseren dus alles. De informatie en gegevens die een bedrijf binnenkomen en verlaten heet in het Engels 'content'. De systemen verantwoordelijk voor het via informatietechnologie verwerken van die inhoud worden 'Enterprise Content Management Systems' of kortweg ecm-systemen genoemd.
Digitaal
De inhoud die een bedrijf zelf aanmaakt, is tegenwoordig vrijwel uitsluitend digitaal. Alleen als we documenten naar buiten sturen gebruiken we daar eigenaardig genoeg vaak papier voor. Ook al hebben zowel zender als ontvanger informatietechnologie in huis. We drukken een brief of factuur met begeleidende documenten af en verzenden die met de post naar een ander bedrijf. Dat moet dan die documenten weer digitaliseren om alles via het eigen ecm-systeem te kunnen verwerken.
Elk stuk informatie of document dat het bedrijf binnenkomt of binnen het bedrijf aangemaakt wordt, moet bij de juiste personen terecht komen en beantwoord en/of gearchiveerd worden. Bij de archivering kunnen er wettelijke vereisten zijn. Een wettelijke verplichting om bepaalde documenten vijf of tien jaar bij te houden, bijvoorbeeld. Als de informatie of het document niet meer nuttig is voor het bedrijf en archivering niet nodig of de opslagtermijn overschreden is, kan die inhoud gewist worden. Zo hebben we een volledige levenscyclus voor digitale inhoud binnen een bedrijf: ontstaan, nuttig gebruik en distributie, archivering, wissen.
Informatiestromen
Een ecm-systeem verzorgt de informatiestromen gedurende de hele levenscyclus van informatie. Voor wat betreft het ontstaan van inhoud vertakt zich dat in twee grote groepen: digitalisering en documentbeheer plus inhoudscreatie. Digitalisering van data is alleen nodig voor informatie die het bedrijf op papier binnenkomt. Dat houdt in het scannen van documenten en het opslaan. Opslaan in de ISO-standaard pdf kan met digitale ondertekening. Het digitale document is dan volledig identiek aan het origineel. Opslaan in een bewerkbaar formaat (Word, OpenOffice) via ocr doen we als de inhoud nog bewerkt of verwerkt moet worden. Zo komen we naadloos terecht bij de inhoudscreatie.
Dat omvat alle documenten en inhoud die we aanmaken met behulp van software. Kantoorsoftware, natuurlijk, maar ook e-mail, webinhoud en grafisch of audiovisueel materiaal. Deze inhoud moet waar nodig beschikbaar zijn voor collaboratie (meerdere mensen werken aan dezelfde inhoud). Dus is er ook sprake van een workflow en een beheer van de inhoud die kaderen binnen de gebruikte zakelijke processen.
Om inhoud beschikbaar te maken voor een of meer personen of om die naar een andere werkgroep of afdeling te sturen voor verdere verwerking, maken we gebruik van opslagsystemen en opslagbibliotheken. Dat omvat alle systemen en media geschikt voor tijdelijke en langdurige opslag (archivering). Hierbij zijn bedrijfsreglementen van toepassing op de tijdelijke en langdurige of zelfs permanente opslag van inhoud. Een ecm-systeem moet dus ook nalevingscontrole mogelijk maken. Niet alle inhoud zal door mensen aangemaakt worden. Binnen het kader van zakelijke processen en de bijbehorende workflow kunnen bepaalde processen voorgedefinieerde inhoud aanmaken of formulieren invullen. Ook dat soort inhoud moet dan verder verwerkt worden met bijhorende beveiliging en integriteitbewaking.
Beveiliging
Voor de verwerking van de eigenlijke data moet er beveiliging zijn op het niveau van de opslag en de distributie van die inhoud. Er moet dus een garantie bestaan dat alleen degene die de correcte authenticatie en autorisatie heeft, toegang heeft tot de inhoud. Bovendien willen we granulariteit in die beveiliging. We zullen voor sommige inhoud willen toestaan dat mensen die mogen bekijken, maar niet wijzigen of wissen. En we willen toegang ook kunnen beperken tot individuen of specifieke groepen gebruikers. Ook weer met onderscheid tussen de activiteiten op die inhoud.
Om alles goed, makkelijk en kostenefficiënt beheersbaar te maken, slaan we onze inhoud zoveel mogelijk op in een standaardformaat. Waar nodig moeten dan formaatconversies gebeuren. De ecm-software moet dat dus ook allemaal ondersteunen. Huidige algemeen aanvaarde standaarden zijn pdf voor inhoud die vastligt en odf en Office Open XML voor data die wel nog veranderd kan worden.
Ondervraagbaarheid
In het bedrijf opgeslagen en gearchiveerde inhoud moeten we gemakkelijk kunnen terugvinden, dat spreekt vanzelf. Die ondervraagbaarheid gebeurt het vaakst door het toevoegen van zogenaamde metadata. Metadata is data over de data, of beter informatie over de opgeslagen inhoud. Denk aan de berichthoofding van een e-mail: die bevat auteur en bestemmeling en een korte onderwerplijn. De metadata bestaat ook uit zulke informatievelden. Het vaakst voorkomend zijn dingen als auteur, trefwoord(en) en data van creatie en laatste wijziging. De meeste ecm-oplossingen bieden aardig wat vrijheid in het zelf definiëren van de gewenste metadata.
Om de inhoud dan terug te vinden, biedt het ecm-systeem een zoekmotor. Indien de ecm-opslag allerlei soorten documenten, web- en multimediainhoud en e-mails bevat, zal deze zoekmotor voor het ecm-systeem ontworpen zijn en qua beveiliging dezelfde bedrijfsregels volgen als de datatoegang. De bekende desktopzoeksoftware is hiervoor niet bruikbaar, tenzij deze ontworpen is om data terug te vinden die op het eigen systeem opgeslagen staat en minder geschikt is voor het zoeken in data die centraal opgeslagen staat.
Integriteitsbewaking
Een ander belangrijk aspect van ecm is ervoor zorgen dat de integriteit van de opgeslagen inhoud verzekerd blijft. Je kunt dit beschouwen als een onderdeel van de beveiliging. Beveiliging bestaat dan uit twee aspecten: integriteitsbewaking en toegangsbeheer. Je kunt de integriteit van inhoud verzekeren binnen het ecm-systeem via versiebeheer. We gaan ervan uit, dat het gebruikte opslagsysteem zijn eigen integriteitsbewaking heeft. Daar kan al versiebeheer bij inbegrepen zijn. In dat geval hoeft het ecm-systeem dat niet te ondersteunen. Wij geven er echter de voorkeur aan dat versiebeheer een onderdeel van het ecm-systeem is, zolang het opvragen van een specifieke versie dan via de ecm-gebruiksinterface gaat en niet via het opslagsysteem dat immers kan verschillen van locatie tot locatie.
Spraakverwarring
Ecm organiseert in feite ongestructureerde informatie. Als het gaat om gestructureerde informatie en het ordenen daarvan, spreken we tegenwoordig over 'Business Intelligence' (bi). Mocht je het weinig zinvol vinden om die twee gescheiden te houden, dan heet de combinatie van bi en ecm Enterprise Information Management of eim. Dan is er nog Content Management Software of kortweg cms. Dat leunt dicht aan bij ecm, maar cms gaat meestal specifiek over het creëren van en collaboreren met webinhoud. Er is een grote keuze aan vrije software die dat mogelijk maakt. Een vergelijking van vrije en commerciële cms vind je in de CMS Matrix.
Oplossingen
Op de markt zijn er twee grote groepen eim- en ecm-oplossingen. De eerste groep is Microsoft-centrisch. Microsoft Sharepoint, Communications Server en Office vormen samen een ecm-oplossing. Deze kan met behulp van informatiewerkerstructuren en portalen uitgebouwd worden tot een compleet eim-systeem. Hierbij ondersteunt Microsoft gewoontegetrouw alleen zijn bedrijfseigen formaten en rijzen er ernstige vragen over de beveiliging van het geheel. In de tweede groep zitten de andere leveranciers. Daar zitten alle vrije softwareoplossingen bij, maar er bestaan ook oplossingen die deels openbron en deels geslotenbron zijn. Dat geldt bijvoorbeeld voor de collaboratieoplossing van IBM. Ook opslagspecialisten (zowel database- als opslagsysteemproducenten) zetten hun eerste stapjes richting ecm: dat geldt niet alleen voor Microsoft, maar ook voor Oracle en zelfs voor EMC. Helaas biedt geen van hen een allesomvattend systeem, maar ontbreken er altijd wel bepaalde componenten, vaak op het gebied van beveiliging, analyse of procesbeheer, of combinaties daarvan.
Je kunt het beste de rapporten van Gartner over ecm en eim in de gaten houden. Dit marktanalysebedrijf volgt de ontwikkelingen en de vorderingen van de ecm- en eim-producenten op de voet en publiceert van tijd tot tijd zogenaamde marktkwadranten die in een oogopslag tonen welke bedrijven winnaars en vernieuwers zijn.
Misschien is het wel aardig te melden dat de hele problematiek rondom informatie nog niet zo lang geleden via papier verliep: het binnenkomen en versturen van informatie noemden we toen inkomende en uitgaande post en datgene wat bewaard moest worden, sloegen we op in het archief.
Om het proces van digitalisering te faciliteren zijn er ook DMS-sen ontwikkeld, document management systemen. CMS en DMS horen beide onder de noemer Enterprise Information Management (EIM). Maar helaas: archief en post “bekken” niet zo lekker en je krijgt met deze termen geen hypes gecreeerd. De essentie voor het beheer van ongestructureerde informatie is in de post- en archief-omgeving wel te vinden: er is niet zo veel nieuws onder de zon – wel uitdagingen om de omslag van papier naar digitaal in de bedrijfsomgeving te beheren. Emailmanagement is slechts een voorbeeld van hetgeen ons nog te wachten staat!
Ik ben het met de auteur van dit artikel eens dat ECM gaat over het beheren van ongestructureerde informatie. En dat dit zo’n 80% van alle informatie is binnen een organisatie, maakt dat het beheren en beveiligen ervan niet moet worden onderschat. Wat ik mis in het artikel is dat beveiliging niet alleen softwarematig maar ook hardwarematig moet worden aangepakt. Daarnaast zou ik willen aangeven dat de oplossingen zoals nu geschetst wel heel erg beknopt is. De softwaremarkt voor ECM oplossingen is veel diverser dan nu wordt geschetst. Ons bedrijf – Strategy Partners – doet al jaren gericht onderzoek naar de spelers in de (Nederlandse) ECM markt en laat zien dat zeker niet altijd de grote Internationale spelers overal even sterk naar voren komen. Bedrijven die zoeken naar een passende oplossing, zou ik dus niet blind varen op de Gartner magic quadrants maar eerst de eigen eisen & wensen goed op een rij zetten!