"Als iemand mij zou vragen welke trends in de informatisering en automatisering de meeste spanningen oproepen, dan mogen het werken met gegevenspakhuizen en Internet beslist niet ontbreken. Dat zijn enerzijds zaken waar je als automatiseerder niet aan kunt ontkomen. Anderzijds moeten er zoveel infrastructuren en lopende projecten voor worden aangepast – met de nodige haken en ogen – dat je toch wel over heel veel lef moet beschikken om daar op korte termijn toe over te gaan."
Die lef moet dan wel op een zodanig hoog niveau in de organisatie verankerd zijn, dat men de consequenties van deze veranderingen niet in al zijn details kan overzien. Iedere zichzelf respecterende automatiseringsmanager zal namelijk met het oog op de continuïteit van de informatievoorziening eerder geneigd zijn om zo’n operatie zo lang mogelijk uit te stellen. Hogerop in de organisatie moet iemand met zoveel visie zitten dat hij de onvermijdelijke desinvesteringen graag op de koop toe zal nemen, als er maar wordt overgegaan op een veelbelovende nieuwe manier van automatiseren.
Normaal gesproken zal men voor zo’n beleid ook nog wel een loodje van echtheid willen hebben van een gerenommeerde consultancy-firma. Dat zou dan toch echt niet meer dan een bevestiging van het voorgenomen beleid moeten zijn. Want zolang de visie en het beleid vanuit kringen van adviseurs moet komen, kan men er maar beter niet aan beginnen.
De problemen die men hierbij tegenkomt lijken in veel opzichten op de problemen in menige grotere organisatie bij de overgang naar een echte client/server omgeving. Dit is echter fundamenteler en abstracter van aard en vereist meer een beleid en een visie op langere termijn. Bij Internet en het werken met gegevenspakhuizen hebben we eigenlijk te maken met praktische toepassingen van de client/server-architectuur, en dus ook met veel concretere zaken die bovendien op korte termijn realiseerbaar zijn.
Het is eigenlijk vreemd dat Internet en het werken met gegevenspakhuizen in het algemeen nog geheel los van elkaar lijken te staan, en dat er in publikaties nog maar zelden een rechtstreeks verband tussen beide trends wordt gelegd. Dat komt waarschijnlijk omdat bij Internet nog te veel naar de technische problemen (zoals beveiliging en benodigde bandbreedte) rondom de wereldwijde communicatie wordt gekeken, en bij het werken met gegevenspakhuizen nog te veel naar de inhoudelijke aspecten van de informatie. Bovendien is de gedachte dat Internet ook bij uitstek geschikt zou kunnen zijn voor de interne communicatie en informatievoorziening binnen een bedrijf nog betrekkelijk nieuw.
De aandacht voor een mogelijke integratie van beide trends zal zeker groeien nu ook de database-leveranciers zich serieus op het Internet geworpen hebben. Ik denk dan ook dat het niet meer zo lang zal duren tot men gegevenspakhuizen aanbiedt, die met Internet zijn opgezet.
Een heel praktische eerste stap in die richting is naar mijn mening gezet met de Alta Vista database, die pas zeer recent door Digital via het Internet voor het publiek is opengesteld (WWW.datavista.digital.com). Deze database bevat een index van alle woorden en combinaties van woorden die in de openbare WWW-pagina’s en nieuwsgroepen over de hele wereld verspreid zijn opgeslagen. Ik haast mij erop te wijzen dat daarmee slechts een fractie van de functionaliteit van een datawarehouse wordt opgepakt. Aan de andere kant is het toch buitengewoon interessant dat zo’n gigantische hoeveelheid documenten, die volstrekt autonoom worden onderhouden, binnen enkele seconden direct toegankelijk kunnen worden gemaakt, waar die documenten en de geïnteresseerden zich ook bevinden. Dit is een wens die in menige grotere organisatie leeft, ook en misschien juist ten aanzien van de interne informatie.
Het gebruik van zoekindexen via Internet is al langer bekend. Maar daarbij zou ik het begrip datawarehouse bepaald niet in mijn mond willen nemen. Bij Alta Vista durf ik dat echter wel te doen, omdat deze combinatie van een centrale index die geheel door Internet wordt gevoed en geraadpleegd, in veel opzichten te beschouwen is als een wereldwijd gedistribueerd datawarehouse van ongestructureerde informatie.