In discussies over datawarehouses worden termen gebruikt als Olap (OnLine Analytical Processing), ETL (Extract Transform Load), analytics en datamining, maar zelden valt de term webservices. Jammer, want webservices heeft datawarehouses wel degelijk iets te bieden. Het toepassen van webservices in een datawarehouse-omgeving kan zeker voordelen bieden en de mogelijkheden van een datawarehouse verrijken.Met enkele voorbeelden zal ik dit duidelijk te maken.
Omdat een datawarehouse een op zichzelf staande omgeving is kunnen er ook externe gegevens in geplaatst worden; gegevens die niet uit de eigen productiesystemen komen. De voornaamste reden hiervoor is dat het in een analyse interessant kan zijn om eigen gegevens te combineren met externe gegevens.
Het binnenhalen van die gegevens uit externe systemen is wel vaak een technologische uitdaging. Ze hebben alle hun eigen talen, formaten en api’s. Dus voor elk extern systeem moet er een op maat gemaakte koppeling gecreëerd worden, en dat is tijdrovend en duur. Met standaarden als Soap (wat de eerste webservice-standaard was) wordt dat gemakkelijker gemaakt. De aanbieder van externe gegevens moet dan wel een Soap-interface ontwikkelen. Maar als elke aanbieder dat doet, zal het probleem voor de datawarehouse eigenaars sterk vereenvoudigen.
Een tweede voorbeeld betreft het kopiëren van gegevens. Hier moet bij de opbouw van een datawarehouse altijd veel aandacht aan geschonken worden. Een proces dat altijd ingewikkelder blijkt te zijn dan dat het initieel leek. Veel organisaties kiezen daarom voor zogenaamde ETL-tools om hierbij te helpen. Een groot nadeel van deze producten is echter dat alle specificaties die ingevoerd moeten worden niet gestandaardiseerd zijn.
Voor webservices is er een nieuwe standaard geïntroduceerd genaamd Bpel4ws. Met deze taal, die in principe is bedacht voor het integreren van applicaties via Soap-webservices, kan veel van de ETL-functionaliteit verkregen worden. Let wel, ook al is de standaard jong, er zijn al verscheidene producten op de markt die haar ondersteunen, waaronder Collaxa, Intalio, Open Storm en See Beyond. En volgend jaar zullen we ongetwijfeld de implementaties van IBM en Microsoft krijgen.
Voor externe gebruikers die het datawarehouse met Olap-tools over het Internet zouden willen benaderen, is een standaard ontwikkeld, genaamd XML/A. De A staat voor analysis. Deze is gebaseerd op de Soap-standaard, en wordt al door enkele producten ondersteund. En dat is het derde voorbeeld waarin datawarehouse baat hebben bij webservices.
Het gebruik van portalen neemt ook in de datawarehousewereld toe. Om portalen te laten werken, zullen ze aan alle onderliggende systemen gekoppeld moeten worden, dus ook aan het datawarehouse. Net als bij de externe gegevens helpt Soap hier bij. Dus als we een Soap-interface op het datawarehouse implementeren, dan zal het eenvoudiger zijn om vanuit het portaal het datawarehouse te benaderen. Maar er is een additionele standaard ontwikkeld genaamd Wsrp (Web Services for Remote Portlets) die gebaseerd is op Soap en die speciaal ontwikkeld is voor het integreren van systemen aan portalen.
Het is eigenlijk jammer dat de datawarehouse-specialist de wereld van de webservices nog niet ontdekt heeft. Het combineren van de twee geeft duidelijk een synergetisch effect. Het vermindert het gebruik van niet-gestandaardiseerde talen, het vereenvoudigt het ontwikkelen van koppelingen met de buitenwereld en verrijkt de mogelijkheden van een datawarehouse. Tijd dus om te gaan studeren!< BR>
Rick F. van der Lans is onafhankelijk adviseur, een internationaal bekend spreker en auteur van diverse boeken, tevens gespecialiseerd in softwareontwikkeling, datawarehousing en internet.