In een master data management systeem (MDM) kunnen we op gestructureerde wijze al onze metadata vastleggen. Referentietabellen, klant- en productgegevens, hun respectievelijke histories, definities, alles past er in. Men zou kunnen stellen dat het de nieuwste categorie producten is voor het vastleggen van metadata.
In een master data management systeem (MDM) kunnen we op gestructureerde wijze al onze metadata vastleggen. Referentietabellen, klant- en productgegevens, hun respectievelijke histories, definities, alles past er in. Men zou kunnen stellen dat het de nieuwste categorie producten is voor het vastleggen van metadata. Sommigen definiëren een MDM gekscherend als metadata++, omdat er meer gegevenssoorten in opgeslagen kunnen worden dan in de oudere metadatasystemen.
Het hebben van een MDM is onontbeerlijk voor het ontwikkelen van integratieprojecten, zoals een service oriented architecture (soa) en een datawarehouse. Ook bij initiatieven als customer data integration kunnen we er niet omheen. Hierdoor is MDM waarschijnlijk een populair onderwerp geworden.
Het is echter de vraag of een MDM alleen wel voldoende is voor een gedegen gegevenshuishouding. Of is het slechts de helft van een oplossing? Zoals vermeld, een MDM is een opslagpunt van metadata. Dat wil zeggen, het beschrijft welke data er zijn en welke data er zouden moeten zijn. Wat minimaal net zo belangrijk is, is dat we controle krijgen over de gegevensfabriek. En daarmee doel ik dan op het doolhof van programma’s, synchronisatie scripts, ETL-processen, message queue koppelingen, federated database lagen, databasetriggers, en wat al niet meer, waarmee we gegevens van de ene naar de andere applicatie kopiëren en repliceren, en waarmee we ze integreren, transformeren en aggregeren. Dit doolhof, dat zich onder de laag met applicaties bevindt, is met niets anders bezig dan met het beschikbaar maken van gegevens voor andere applicaties. Die gegevens dienen daar dan op het goede moment, in de goede vorm, correct geaggregeerd, beschikbaar te zijn.
Denk hierbij aan de ETL-scripts waarmee we gegevens van productiesystemen naar datawarehouses kopiëren. Denk ook aan synchronisatieprogramma’s om gegevens die, bijvoorbeeld, in een ERP-pakket opgevoerd worden, beschikbaar te maken in een zelfgemaakte internetapplicatie.
In deze scripts en programma’s zit veel logica verstopt. Gegevens kunnen een lang en complex pad afleggen voordat ze bij de geschikte applicatie in de goede vorm aankomen. We moeten ervoor zorgen dat we meer inzicht en controle over deze gegevensfabriek gaan krijgen. Veel organisaties kunnen alleen na een lange studie aangeven hoe bepaalde gegevens van de ene bij de andere applicatie terechtkomen. Het is dus niet voldoende om alleen maar te beschrijven welke data er zijn. Hoe we gegevens bewerken, is minimaal net zo belangrijk.
Diverse organisaties zijn nu bezig hun applicaties via een ESB te integreren tot een op elkaar afgestemd geheel. Misschien moeten we voor de gegevens eenzelfde exercitie uitvoeren. Misschien moeten we ook hier een bus voor ontwikkelen. Jan Henderyckx, een consultant uit België, heeft al de term Enterprise Sewer Bus voorgesteld. Omdat dit een naam is met een enigszins negatieve klank, zou ik zelf iets neutralers willen voorstellen: de Enterprise Data Bus. De EDB is verantwoordelijk voor het op tijd en correct beschikbaar maken van gegevens voor alle applicaties. Ook het opschonen van gegevens is een taak van de EDB.
Uiteraard dient het hart van deze EDB gevormd te worden door een MDM; het MDM als hart en het EDB als de spieren en de bloedvaten.
Dus is een MDM voldoende? Naar mijn mening niet. Zonder EDB zal het MDM, net zoals vele andere metadata oplossingen, zoals CASE, iCASE, DD/DS en information directory, teveel in een isolement terechtkomen.
Rick van der Lans
Beste heer van der Lans,
Ik ben erg blij met uw verhandeling over MDM. Ik en ook de organisatie waarvoor ik werk, onderkennen het belang van een MDM oplossing incl. een data integratielaag om de in uw artikel beschreven zaken als bron analyse, ETL en data kwaliteit op een transparante en eenduidige manier het hoofd te kunnen bieden. In de markt staat dit bekent onder de term Master Data Integration (MDI). Bij het vergelijken van MDM oplossingen door bedrijven is het dan ook zaak MDI mee te nemen in een beslissing.
Mooi concept een centrale data-vijver voor meerdere bedrijven
Ik hoop wel dat dit dan – i.v.m. privacy – goed afgeschermd is wie bij welke data kan en waarom.
Hoe meer data je bij een brengt, des te groter is de kans op een single point of failure in je bedrijfsprocess. Laat staan als je “company datavijver” een keer gehackt gaat worden, kunnen ze makkelijker in een keer bij al je gegeven.
Lang leve Distributed Data en Distributed Intelligence:
Goed samenwerken op een need-to-know basis voelt voor mij veel veiliger aan dan zo maar alle data samenvoegen in een vijver.