Documentbeheer heeft zich de laatste jaren een hippe verpakking aangemeten: XML. Dat belooft universele uitwisselbaarheid, maar de realiteit is genuanceerder. Pakketten voor documentbeheer beperken de exportmogelijkheden naar andere formaten, onder andere omdat de leveranciers de zin van het uitvoeren naar open standaardformaten niet inzien.
Grote leveranciers als Hummingbird, FileNet en EMC Documentum leveren api’s voor de uitvoer en ondersteunen XML wat de metadata betreft. Volstaat dat? Veel gebruikers vinden de XML-ondersteuning mager. Zelfs de beroepsvereniging van de leveranciers vindt dat er dringend meer openheid moet komen tussen de pakketten onderling. Voorlopig is het resultaat dat gebruikers met een gemengde omgeving opgezadeld worden met informatiesilo’s. Immers, hoe kun je van het ene gesloten formaat naar het andere uitvoeren als je niet beschikt over de middelen of zelfs maar de instructies om dat te doen?
‘Wij doen XML’ blijkt in de praktijk neer te komen op een uitvoermogelijkheid waarbij geen XML Schema of -DTD (Document Type Definitions) wordt bijgeleverd. De gebruiker staat er dus alleen voor. Gespecialiseerde marktonderzoekers als Ovum vinden overigens het gebrek aan uitvoer naar XML en ondersteuning van XML Schema en DTD’s normaal. Principal analyst Chris Harris-Jones stelt dat uitwisseling van informatie via XML bij documentbeheer wellicht niet het beste antwoord is op het probleem. “Misschien zijn er wel andere formaten die een beter mechanisme leveren.” Daarbij verwijst hij naar de leverancierspecifieke exportmogelijkheden.
De Ovum-analist vindt dat bedrijven de api’s moeten gebruiken die de leveranciers van documentbeheer ontwikkelen. Zelfs het open ISO-formaat ODF (Open Document Format) doet Harris-Jones af als ondermaats. “Het is goed dat het er is, maar ik zie er fors aan gesleuteld worden de komende vijf tot tien jaar voordat het echt bruikbaar is.” Volgens hem zien leveranciers het nut niet in van XML als uitvoerstandaard omdat ze van oordeel zijn dat ze met hun ‘rijke’ api’s meer dan voldoende mogelijkheden bieden om informatie-eilanden te voorkomen.
Afhankelijk
Erik Hartman, onafhankelijk adviseur op het gebied van informatiearchitectuur, contentbeheer- en communicatiestrategie, en president van de internationale organisatie CM Professionals, is het daar niet mee eens. “Allereerst vallen die ‘rijke’ api’s in de praktijk vaak tegen. Iedereen die te maken heeft gehad met het uitwisselen van informatie tussen verschillende (document)managementsystemen zal dat beamen.” Verder vindt Hartman als informatiearchitect dat je interoperabiliteit niet moet oplossen in de toepassing maar in de informatie zelf. Daar is XML bij uitstek geschikt voor: het is een open standaard waarmee je onafhankelijk van het platform en de applicatie informatie kunt uitwisselen. “Vooral het open karakter van XML is cruciaal. Bij api’s ben je altijd afhankelijk van de leverancier van de betreffende toepassing. Met XML kan je ook vrij gemakkelijk semantische informatie meegeven. Dat is essentieel bij dergelijke ongestructureerde informatie.”
Harris-Jones denkt dat de documentbeheerders XML nooit enthousiast zullen onthalen zolang Microsoft lauw reageert. “Bovendien kunnen de meeste pakketten XML Schema en -DTD’s invoeren. Waar ligt dan het probleem? Een DTD kun je ook zelf schrijven.” Hartman denkt echter verder. “Digitale duurzaamheid is een factor. Moet een archief echt al die api’s onderhouden en bijwerken om informatie tussen al die systemen aan te leggen? Ook hier zijn open standaarden, zoals ODF en XML, het antwoord, en niet emulatie, migratie of pdf.”
Adobe zal het niet graag horen, want pdf is een ISO-standaard voor archivering van documenten op lange termijn. PDF/A heeft het ISO 19005-1 certificaat gekregen. Alle documentbeheersystemen ondersteunen conversie naar PDF/A. Deze standaard gebruikt overigens XML in de vorm van XMP (eXtensible Metadata Platform) om metadata mee te geven met het geconverteerde document. Hartman doelde echter niet op PDF/A, maar op pdf zonder meer: “Het probleem is dat de Archiefwet, waarnaar ik refereer, niet over PDF/A praat, maar over pdf.” In elk geval interpreteren de overheidsgebruikers het formaat waarom de Archiefwet vraagt als de huis-tuin-en-keuken pdf, en niet als PDF/A. Dat is op zich weer een probleem.
Onhandig
Overigens is XML als metadatacontainer niet voldoende, blijkt zelfs uit gesprekken met de leveranciers. Bij EMC Documentum bijvoorbeeld wordt steeds vaker gevraagd naar archivering in zuivere XML, aldus systems engineer en consulent Menno Odijk. “Vooral de Nederlandse overheid vraagt daarnaar, omdat het Nationaal Archief erg XML-gericht is.” Niet alle documenten zijn om te zetten naar XML. “Toch zal het nog aan belang winnen, al was het maar omdat Microsoft Office 12 het overvloedig zal gebruiken.” EMC Documentum heeft XML al volop in de planning zitten.
Andere leveranciers, zoals Hummingbird, hebben een andere mening. De filosofie van Hummingbird is dat je met converteren beter kunt wachten tot het allerlaatste moment: het ogenblik waarop de oorspronkelijke documentcreatiesoftware niet meer wordt ondersteund. Een conversie vroeger doorvoeren zou alleen maar tot documenten leiden die met elke nieuwe versie van het archiefformaat opnieuw een conversieronde moeten ondergaan. Die redenering kan geldig zijn voor archivering, maar niet voor informatie-uitwisseling.
Rein de Graaf, business architect bij de Public Group van Unisys, die projecten uitvoert voor de overheid, ziet dat probleem met Hummingbirds XML-ondersteuning dagelijks opduiken. “Hoewel het voor steeds meer overheidsinstellingen een vereiste is dat XML volop wordt ondersteund, doen ze daar voorlopig niet veel mee, maar dat kan snel veranderen. Hummingbird is nogal gericht op Microsoft Office. Met versie 12 later dit jaar moet alles sowieso langs XML lopen.”
Hummingbird bevestigt deze visie, en voegt toe dat XML voorlopig alleen gebruikt wordt voor het meeleveren van metadata. De documenten en mappen zelf blijven altijd in hun oorspronkelijke formaat. Dat bevordert de uitwisseling tussen documentsystemen niet. Het enigszins onhandige antwoord van Hummingbird is dat het volop bezig is met het integreren van het pakket in Microsoft SharePoint. Ook dat is een niet echt open omgeving voor informatie-uitwisseling.
Syndroom
Hartman: “AIIM (The Enterprise Content Management Association) heeft niet voor niets het initiatief iECM (interoperable enterprise content management) omarmd. Dit is echt een enorm probleem voor al die organisaties die meerdere informatiesystemen (document, records, content, werkstroom of wat voor informatiemanagementsystemen dan ook) gebruiken en met elkaar proberen te koppelen. Dat is geen sinecure. Hier worden ettelijke miljoenen verloren aan maatwerk of nog erger: het wordt niet eens geprobeerd omdat het een onmogelijke klus lijkt, met alle informatieproblemen van dien.”
Het ziet ernaar uit dat daar binnen een paar jaar verandering in komt. EMC Documentum is actief lid van het iEMC-initiatief, dat de uitwisseling van informatie tussen documentbeheersystemen via XML wil verbeteren. Ook FileNet en Hummingbird doen mee, naast mindere goden als Infostoria, Stellent, en Nuxeo. Hartman denkt echter dat het niet van een leien dakje zal gaan. “XML komt uit een totaal andere wereld: die van uitgevers. Kort door de bocht gezegd: SGML werd XML. Deze ontwikkeling is volledig langs de traditionele documentmanagementwereld heen gegaan. Dit geldt overigens niet voor de wereld van de technische documenten, zoals handboeken, maar de klassieke scan- en uitvoerwereld snapt het concept gewoon niet. Die mensen denken ten eerste niet verder dan de grenzen van een document. Ze staan niet stil bij het concept ‘informatie’, dat veel breder is dan een document. Ten tweede hebben ze te lang vast gehouden aan eigen standaarden, zoals ODMA, maar dat is nooit succesvol gebleken. Het syndroom van ‘niet hier uitgevonden’ is dus een groot probleem.”
Volgens Hartman wordt neerbuigend over XML gesproken, alsof dat alleen is voorbehouden aan webcontentbeheer. “Die mensen worden straks allemaal geconfronteerd met het fenomeen ‘multichannel’ en hebben daar geen antwoord op. Zomaar een webcontentbeheersysteem toevoegen aan je productenpakket maakt je nog geen ‘helemaal ecm’-speler.” De nieuwe trend is hergebruik van informatie op een flexibele en eenvoudige manier. Documenten in gesloten systemen lenen daar zich bij uitstek niet voor. “Dat begrijpen klanten op een gegeven moment. Dan eisen zij open standaarden van hun leveranciers. Het is toch van de zotte dat je afhankelijk bent van een applicatie en de bijbehorende leverancier om bij je eigen digitale informatie te komen?”
Open of gesloten
In 2005 zei de Amerikaanse overheid (grootgebruiker van StarOffice en OpenOffice, de open kantoorsoftware van Sun, IBM en Novell) dat ze absoluut wil vermijden dat ze in de toekomst vastzit aan leverancierspecifieke documentformaten. Prompt gingen de drie aan het werk. ODF (Open Document Format) werd een standaarduitvoerformaat in StarOffice 8.0 and OpenOffice.org 2.0. Het echte werk daarvoor is gedaan door leden van het OASIS-consortium (Organization for the Advancement of Structured Information Standards).
Microsoft voelde zich in een hoek gedreven en kondigde al snel Office 2007 aan, dat helemaal op XML gebaseerd zal zijn. Dat is net op tijd, want sommige Amerikaanse staten, zoals Massachusetts, gaan in januari resoluut over op ODF als documentformaat, met pdf voor documenten die klaar zijn voor archivering. Microsoft deed nog een zwakke poging om Massachusetts te overtuigen over te schakelen op zijn XML-formaat. Dat weigerde die staat, omdat de vereisten die de softwarereus voorschrijft aan zijn documentattributen te moeilijk in te vullen zijn. Na wat bijsturingen (de belangrijkste is dat het bedrijf stappen heeft gezet om zijn XML-formaat als ISO-standaard te laten ratificeren) besloot Massachusetts het Microsoft-formaat toe te voegen aan de lijst van acceptabele formaten.Het is de vraag in hoeverre Microsofts XML echt een open standaard zal zijn. Voor zakelijke gebruikers komt die vraag neer op de bereidwilligheid van de leverancier om andere organisaties en bedrijven toe te laten naar het formaat weg te schrijven op een betrouwbare manier. Daarvoor moet de softwarereus ‘zijn’ XML voldoende documenteren voor externe partijen. Een andere voorwaarde is dat Microsoft het formaat laat zoals het is, en er geen eigen ‘verrijkingen’ aan toevoegt. Gartner Group denkt dat de onderneming te vertrouwen is, maar verwacht ook dat ze de standaard zullen uitbreiden met een eigen XML Schema. Verder benadrukt Gartner dat elke open standaard in combinatie met andere technieken weer gesloten kan worden. Een documentbeheerproduct dat alleen op Microsofts XML-brouwsel gebaseerd is, kan dus weer gesloten worden. Zo leidde ODMA (Open Document Management api), de poging van leveranciers van documentbeheer om openheid te creëren, jaren geleden ook al nergens toe.