Er moet niet gestreefd worden naar een zaligmakende business-ontologie; dit is de oude fout van het ondernemingsbrede datamodel. M.V. Jonkers en M.E. Sanders over het ambitieniveau van ontologieën.
De toepassing van ontologieën voor gegevensontsluiting roept bij de heer König vragen op, zo blijkt uit zijn reactie op ons artikel ‘Het nieuwe gegevenspakhuis gaat bovengronds’ (Computable, respectievelijk 30 en 2 april). In dat artikel geven we een overzicht van een aantal nieuwe technieken die op het punt staan een rol te gaan spelen bij het oplossen van gegevenspakhuis-achtige problemen.
Voor een succesvol gebruik van een gegevenspakhuis zijn goede beschrijvingen van de beschikbare gegevens, metagegevens, essentieel. De correctheid van deze metagegevens is alleen op economische wijze te garanderen als ze gekoppeld zijn aan de feitelijke gegevens. De metagegevens moeten leidend zijn: zij bepalen hoe gegevens in het pakhuis tot stand komen.
De door de business gehanteerde begrippen kennen wel degelijk exacte definities, de omzet wordt niet uit de losse pols berekend. Het probleem zit erin dat op uiteenlopende wijzen tegen dezelfde gegevens wordt aangekeken: de ene afdeling ziet een en/of-rekening als één rekening, de andere als twee. Automatiseerders moeten niet proberen de business tot dezelfde definities te dwingen, maar hen de middelen geven om zelf, in business-terminologie, hun gegevensbehoefte te specificeren. Op dat niveau kan de business zelf achter het stuur gaan zitten.
De huidige metagegevens lenen zich hier nauwelijks voor. Ze zijn het antwoord van de automatiseerder aan de zakenman in de ballon, die vraagt waar hij is: ‘Je zit in een rieten mand, die hangt onder een ballon, op 30 meter boven de grond’. De metagegevens beschrijven slechts de structuur van gegevens. De betekenis ervan is hooguit in natuurlijke taal gegeven. Maar daarmee is het slecht specificaties maken.
Gegevensintegratie
Met een ontologie wordt beschreven hoe concepten samenhangen: een ballon is een voertuig, met een locatie en een bestemming. Niet alleen voor de gebruiker kan de betekenis van gegevens zinvol worden vastgelegd; het is een beschrijving in een kennissysteem waarover geautomatiseerd geredeneerd kan worden. Hiermee zijn deze hogere-orde metagegevens bij uitstek geschikt voor de actieve, leidende rol waaraan behoefte is. De wetenschap grijpt ontologieën dan ook aan als de oplossing voor intelligente gegevensintegratie. Maar ook het bedrijfsleven begint ontologieën op te pakken, bijvoorbeeld voor gegevensuitwisseling met partners (voor meer commerciële voorbeelden, zie http://www.ontology.org).
In hun nieuwe rol worden ontologieën pragmatisch benaderd. Er moet niet gestreefd worden naar een zaligmakende business-ontologie; dit is de oude fout van het ondernemingsbrede datamodel. Incrementeel en toepassingsgericht kunnen de concepten van een bronsysteem gerelateerd worden aan die uit de belevingswereld van een gebruikersgroep. Natuurlijk zal het ambitieniveau van deze ontologieën in het begin niet hoog zijn en zullen de ontologieën aanvankelijk nog sterk de bronsystemen weerspiegelen. Gaandeweg kan verdieping worden aangebracht – het resultaat staat voorop.
Drs M.V. Jonkers en Ir M.E. Sanders,
Ordina Utopics Innovatiecentra