In strijd met de opvatting van Michael Stonebreaker hebben xml-databases wel degelijk bestaansrecht, meent Marcel Noordzij. Het zal nodig zijn ontvangen xml-documenten vast te houden, waarvan op voorhand niet bekend is aan welk ‘schema’ deze voldoen. Het opslaan van xml-gegevens is juist het gebied waarin xml-databases uitmunten.
Als we de heer Michael Stonebreaker – uitvinder van de relationele database Ingres en de objectgeoriënteerde database Illustra – moeten geloven, hebben xml-databases geen bestaansrecht. Niemand is immers gebaat bij het opslaan van documenten. Nee, we willen alleen data opslaan. Dat slechts 20 procent van de gegevens die vandaag de dag door ondernemingen stroomt, te vangen is onder de noemer ‘data’, is hierbij blijkbaar onbelangrijk. Leren van onze fouten en deze in de toekomst niet herhalen is belangrijker dan het verbeteren van processen die nu nog verre van efficiënt verlopen. Wat de heer Stonebreaker over het hoofd ziet, is dat xml-databases niet bedoeld zijn als vervangingsmarkt voor de reeds geautomatiseerde systemen, die perfect in een relationele wereld passen. Dus de SAP’s en Siebels kunnen gewoon hun ding blijven doen in de oude, vertrouwde databases, zonder dat er semantische verwarring ontstaat. Bij de overige 80 procent documenten kunnen de voordelen van xml en de hierbij behorende xml-opslag ten volste worden benut. Gestructureerde documenten die te traceren zijn, die geheel of gedeeltelijk hergebruikt kunnen worden en die publicatie- en pakketneutraal zijn – dat zijn de voordelen van xml die pas echt tot hun recht komen in een xml-database. De voordelen van een database in het algemeen zijn evident; dat je zaken op moet slaan in een omgeving die hiervoor gemaakt is, is ook kristalhelder. We bewaren onze kaas niet voor niets in de ijskast.
Semantische verwarring
De heer Stonebreaker gaat er vanuit dat er semantische verwarring ontstaat bij het toepassen van xml-schema’s. Dit roept direct de vraag op hoe je dan durft te beweren dat xml een goed mechanisme is voor het uitwisselen van gegevens. Het gevaar voor semantische verwarring is binnen de bedrijfsgrenzen nog te kanaliseren, maar buiten de organisatie waar met vele partijen gecommuniceerd wordt, is dit dodelijk. Gezien het succes van xml in deze omgevingen lijkt het erop dat de beweringen van de heer Stonebreaker op dit terrein gelogenstraft worden. Iets wat hij eigenlijk zelf ook al beweert. Het grote voordeel van xml-schema’s is zelfs dat er schema’s van de plank getrokken kunnen worden die door de wereldwijd opererende organisatie worden vastgelegd. Hierdoor neemt de semantische verwarring af en gelden de voordelen van standaardisatie. Denk alleen maar aan de voordelen die een standaardisering van adresgegevens zou kunnen opleveren. Het is echter niet alleen een standaardtechnisch schema dat dit op kan lossen: of iets een standaard wordt, wordt bepaald door de marktacceptatie’.
In feite geeft de heer Stonebreaker zelf aan wat het grootste toepassingsgebied is voor xml-databases. In de wereld van elektronische handel is het een utopie dat er één standaard rond uit te wisselen documenten ontstaat. Wel is duidelijk dat xml de uitwisseltaal wordt. Het aantal uitgewisselde documenten zal toenemen, niet alleen in kwantiteit, maar ook in aantal typen. Hierdoor wordt men gedwongen ontvangen documenten vast te houden, waarvan op voorhand niet bekend is aan welk xml-schema deze voldoen.
Het opslaan van xml-gegevens, waarvan op voorhand alleen bekend is dat het een xml-document betreft, is nu precies het gebied waarin xml-databases uitmunten. Natuurlijk kan dit ook in het, vanuit xml-perspectief gezien, verouderde relationele model. Het gebruik van een LOB (Large Object) is een mogelijkheid, maar dat wordt door de relationele experts gezien als vloeken in de kerk. De documenten worden weliswaar opgeslagen, maar ze zijn niet doorzoekbaar en er kunnen geen ‘cross queries’ of analyses op losgelaten worden, wat standaardfaciliteiten zijn van de ‘verguisde’ xml-databases.
Teruggrijpen op de historie werkt; afhankelijk van hetgeen je wilt zien is er altijd een positief of negatief bewijs te leveren. De toekomst zal echter leren wie er gelijk had.
Marcel Noordzij, Manager XML Competence Center Software AG Nederland