Metadata zijn de regels en definities die structuur en consistentie leveren aan databases en processen. Veel analisten brengen positieve rapporten en analyses uit over het gebruik van deze metadata, maar het is niet alles goud wat er blinkt. Bedrijven die een metadata-project overwegen, moeten rekening houden met risico’s veel inspanningen en hoge kosten. Maar als het eenmaal werkt, verdient het zich wél in een jaar terug.
Regels voor het bewerken van data-elementen, lay-outs voor rapporten, datawoordenboeken en objectmodellen: het zijn allemaal voorbeelden van metadata. Traditioneel verbonden met XML zijn metadata erg belangrijk, omdat ze het abstractieniveau leveren dat nodig is om grote aantallen toepassingsgegevens in een verstaanbare vorm voor te stellen. Bovendien leveren metadata de ‘hefboom’ om die vorm te kunnen wijzigen naar een andere vorm of voorstelling, zodat die de zakelijke realiteit van het ogenblik beter beschrijft. Voor het gebruik van metadata valt veel te zeggen, vinden klaarblijkelijk ook de meeste analisten, zoals Gartner. Zij besteden er veel aandacht aan en meestal zijn hun rapporten en analyses erg lovend en positief. In een onlangs verschenen ‘Planning Assumption’ belichten Lou Agosta en Jon Erickson van de Giga Information Group echter een andere kant van de implementatie en het gebruik van metadata. Zij stellen onomwonden dat metadata in sommige gevallen meer financiële schade kunnen berokkenen dan ze verondersteld worden te besparen.
Slimmer werken
Agosta en Erickson zien, net als Gartner, in metadata een hefboom om ontwikkelingsgebonden en operationele activiteiten efficiënter te maken. Metadata maken het volgens hen vooral mogelijk slimmer te werken, want ze slaan immers een brug tussen disparate systemen. Organisaties die efficiënter willen werken, zoeken uit hoe ze hun bestaande, heterogene systemen beter kunnen laten samenwerken. Daarbij valt het accent niet alleen op een betere uitwisseling van datastromen en het hergebruik van data en datamodellen, maar ook op hoe service en ondersteuning goedkoper en beter kunnen. Voor die organisaties zijn metadata een belangrijke hulpbron, in zoverre dat Agosta en Erickson aanbevelen er een absolute prioriteit aan te geven. Ook Gartner vindt dat, zoals blijkt uit een ‘Research Note’ van begin april, waarin analist Comport metadata een sleutel noemt tot toepassingsbeheer. Agosta en Erickson waarschuwen echter dat it-afdelingen, vooraleer ze een metadata-initiatief opstarten, eerst eens heel goed – en objectief – moeten kijken naar de kosten en de opbrengsten, de risico’s en opties die een metadata-gedreven implementatie met zich meebrengt. Giga vond immers dat vooral beheersbaarheid van een metadata-project cruciaal is voor het slagen ervan. Volgens Agosta en Erickson vind je de voorwaarden daartoe slechts terug in organisaties die al een traditie hebben van goed uitgedachte automatiserings- en datamanagementpraktijken. Andere organisaties zullen eerst behoorlijk wat geld en tijd moeten investeren in het opzetten van de regels hiervoor. Voor organisaties die aan de noodzakelijke voorwaarden voldoen, bevelen de twee analisten aan om metadata te implementeren in datawarehouse-toepassingen, in procedures voor databeheer en in de ‘system development life cycle’ (sdlc). Metadata kunnen dan de coördinatiekosten verlagen tussen datawarehouse- en transactiesystemen. Ze ‘vertalen’ immers de gegevens in de overgang van het ene systeem naar het andere en transformeren ze ook nog eens automatisch. Voordelen van het toepassen van metadata in de sfeer van databeheer en sldc zijn de mogelijkheid tot impactanalyse, ‘change control’ en kwaliteitsrapportage met betrekking tot het systeemontwerp. Bij al deze toepassingen zijn metadata veel efficiënter dan het manueel overzetten van de data van het ene systeem in een vorm en ’taal’ die het andere systeem begrijpt. Sterker nog, eigenlijk vormen ze het enige bruikbare alternatief.
Risico’s
Zonder nauwgezette planning wordt een organisatie al gauw geconfronteerd met zoveel verschillende voordelen en voordeeltjes van het gebruik van metadata, dat het gevaar bestaat door de bomen het bos niet meer te zien. Zonder recente, accurate en hoogkwalitatieve metadata moet er aan een project niet begonnen worden. Met name als het de bedoeling is een brug te slaan tussen datawarehousing en transactiesystemen, tonen slechte metadata al gauw de weg naar de verminderende meeropbrengsten. Dat komt omdat beide betrokken groepen ontwikkelteams na korte tijd steeds harder moeten gaan werken om de vele ‘many-to-many-interfaces’ te onderhouden. Gartner geeft een voorbeeld van hoe een softwarepakket geïntegreerd kan worden met een ander. Pakketten zijn per definitie al niet erg vergelijkbaar, maar in een metadata-project moeten ze als gelijken (‘peers’) kunnen optreden. De eerste uitdaging bestaat er dus in om het integratiemodel van zo’n pakket uit te breiden van zijn ‘natuurlijke’ punt-naar-punt-model naar een architectuur waarin alle deelnemers informatie kunnen delen als gelijken. Nodeloos te zeggen dat die uitwisseling ook nog snel moet gebeuren. Het tot stand brengen van de technische connectiviteit tussen verschillende pakketten, is daarbij niet de kunst. Het verzoenen van de semantische verschillen tussen de zakelijke definities en de technologische processen is dat wél. Daartoe moet ook rekening worden gehouden met de bredere context van de organisatie, haar markt, haar zakelijke processen en de verschillen in benadering van elke toepassing die in de organisatie draait. Een ander groot risico bij het implementeren van metadata is dat er eigenlijk niks wordt geproduceerd. Het is heel verleidelijk om te blijven hangen in het stadium van de vorming van documentatie. Documentatie levert echter geen inzicht in de interacties tussen de diverse systemen. Nog een risico betreft de nauwkeurigheid van de semantiek. Dubbelzinnigheid in datadefinities en een gebrek aan duidelijke terminologie verhinderen een impactanalyse. Een metadata-instrument is ook geen op zichzelf staande oplossing. Bedrijven waar de it-afdeling sterk de neiging heeft om oplossingen te kopen, hebben nog wel eens de neiging om dat te denken. Maar metadata zijn enkel een antwoord op de vraag hoe je uiteenlopende systemen met elkaar kunt laten praten om zakelijke gebruikers te dienen. Een goede leverancier van metadata-repository zal dit misverstand proberen te voorkomen door sjablonen te leveren en door aanbevelingen te doen voor uitwisselingsprocessen en -methodes. Veel van die leveranciers zien het gebruik van XML binnen standaarden als het ‘common warehouse metamodel’ (cwm) als het hulpje dat instrumenten doet samenwerken.
Kosten
Zelfs als alle voorwaarden voor een goede implementatie voorhanden zijn, kost een metadata-project nog een bom duiten. Er zijn bovendien extra factoren die de kosten kunnen doen oplopen. Zo is er bijvoorbeeld de coördinatie van het beheer van de metadata – zowel van de structurele, de toepassingsgebonden, de operationele als de zakelijke metadata. Ook het gebruik van pakketten drijft de kosten op. Pakketten zijn ten aanzien van metadata immers – zie het voorbeeld van Gartner – eigenlijk zwarte dozen. Ook de frequentie waarmee systemen worden aangepast en gewijzigd – Giga noemt het, niet ongepast, de ‘volatiliteit’ ofwel vluchtigheid – speelt een rol in de kostenberekening. Het spreekt voor zich dat systemen die vaak worden omgegooid, duurder in de aanpak zijn omdat ook de metadata telkens zullen moeten worden aangepast. Eén kostenfactor is vrijwel niet uit te sluiten en dat zijn de rationalisatiekosten. Rationalisatie is het proces waarbij betekenis wordt geput uit de ruwe metadata, zoals die voorkomen in legacysystemen, pakketten en op maat gemaakte toepassingen. Bijna nooit zijn die ruwe metadata consistent, accuraat en ondubbelzinnig. Maar ze moeten dat wél zijn om een vertaling tussen systemen onderling mogelijk te maken. Rationalisatie vereist dus een inspanning in het classificeren, vergelijken en verduidelijken van het ruwe materiaal. Deze kostenfactor is aanzienlijk, omdat het menselijke tussenkomst vereist én omdat de inspanning lineair stijgt met het aantal data-elementen en met de complexiteit van de interfaces. Ook als de metadata gedistribueerd zijn, kost het rationaliseren ervan meer dan wanneer ze centraal worden bewaard en gebruikt. Overigens bieden goedkope of gratis meegeleverde metadata-repository’s geen soelaas. De gratis met Microsoft SQL Server metadata-repository bijvoorbeeld vereist een substantiële inspanning om de repository in elkaar te knutselen. Anderzijds kosten specifieke metadata-repository’s die bij metadata-instrumenten worden geleverd, meestal enkele honderdduizenden euro’s
Voordelen
Het verzamelen, toepassen en beheren van metadata heeft grote voordelen. Operationele efficiency in systeemontwerp en -constructie is er één van. Hergebruik en impactanalyse worden mogelijk. Verbeteringen in de zakelijke processen, it-communicatie en het in lijn stellen en integreren van de gegevens van diverse systemen zijn een paar andere voordelen. Hoewel de kosten belangrijk zijn, rekenden Agosta en Erickson uit dat de voordelen op financieel vlak al gauw de kosten overstijgen. In hun ‘Total Economic Impact’-model – een soort verbeterde versie van Gartners tco – scoort een typisch project behoorlijk, met een terugbetaling na een jaar en een winst van 25 procent na drie jaar. Die winst wordt gehaald door het verbeteren van de productiviteit van de it-afdeling door de impactanalyse, lagere kosten voor het implementeren en integreren van systemen, een sneller onderhoud en een kortere implementatietijd, versiecontrole, interoperabiliteit, integratie van warehouses met transactiesystemen en door betere communicatie tussen it en de rest van het management, wat weer leidt tot betere beslissingen.< BR>