Gartner Group voorspelt een vervijfvoudiging van de markt van gegevenspakhuizen, naar een omvang van 5,5 miljard dollar, over drie jaar. Het afgelopen jaar is er discussie ontstaan over de definitie van een datapakhuis. Vast staat in ieder geval dat de kleine pakhuizen, de zogenoemde datamarten, het in de praktijk het best doen. Zij leveren forse besparingen op.
De discussie over de definitie spitst zich toe op de vraag welke gebruikers toegang hebben tot gegevens. Ook is er verwarring over de begrippen ‘gegevenspakhuis’ en ‘beslissingsondersteunend systeem’ (dss, decision support systeem).
Harry Zimmer, senior consultant bij NCR, stelt in een White Paper dat de meeste rdbms’en (relationeel database management systeem) komen uit transactieverwerkende omgevingen. Hierbij ligt het accent op het snel verwerken van hoge volumes. Verder worden deze omgevingen gekenmerkt door een bepaalde responsetijd en bevatten ze weinig historische gegevens. Bij beslissingsondersteunende systemen gaat het vooral om het kunnen selecteren van grote hoeveelheden historische gegevens.
Zimmer wijst er dan ook op dat de selectie van de juiste relationele database een sleutelrol speelt in het al of niet slagen van een gegevenspakhuis. "De techniek van databases ontwikkelt zich snel. Het is raadzaam om uiterst zorgvuldig te werk te gaan bij de selectie en om bij voorkeur een techniek te kiezen die zich in de praktijk bewezen heeft. Zimmer stelt dat gegevenspakhuizen in de helft van de gevallen mislukken. "In het ergste geval is het project niet afgerond. Ook komt het voor dat een produkt wordt gebouwd dat niemand gebruikt, omdat het niet goed is afgestemd op de eisen van de gebruikers."
Volgens Zimmer mislukken gegevenspakhuizen vaak omdat het niet duidelijk is wie er de baas over is. "Meestal gaat het om een onderneming met een MVS mainframe-omgeving. Het opzetten van een gegevenspakhuis is veelal het eerste project dat werkt met een open (Unix-) systeem. Omdat er twijfel is over het effect van een gegevenspakhuis, loopt de strijd over het beheer uit in een machtsstrijd. Die leidt er vaak toe dat het project mislukt of uitmondt in een onwerkbaar produkt."
Ruim terugverdiend
Bij de Engelse vestiging van de Makro is nu ruim een jaar een gegevenspakhuis in gebruik. "In die periode is de investering al ruim terugverdiend", zegt Vivienne Cramer, directeur marketing van die vestiging.
"Het grote probleem was bij ons dat we wel winst maakten, maar dat het vooral gebaseerd was op intuïtie en niet op feiten. We stuurden tot voor kort om de veertien dagen naar al onze drie miljoen klanten een krant. Dankzij het datawarehouse hebben we de oplage kunnen terugbrengen naar een miljoen".
Een sleutelrol in de nieuwe manier van het bewerken van de markt speelt de Teradata-database. Cramer praat dan ook nauwelijks over het nut van datawarehousing, maar heeft het consequent over de Teradata-database, de techniek die NCR vier jaar geleden in huis haalde met de overname van Teradata. Kenmerkend van deze database is het perfectioneren van parallelle technieken. Daardoor beantwoordt de database ingewikkelde vragen extreem snel.
"We hebben 50.000 produkten en een klantenbestand van drie miljoen bedrijven", vertelt Cramer. "Een database die dergelijke grote bestanden via bepaalde criteria doorzoekt moet extreem snel zijn. Dat kan alleen met parallelle technieken."
Toch zijn er ook grenzen aan de ingewikkeldheid van vragen, zo beaamt Cramer. "Op vragen van het management heb ik vaak moeten antwoorden dat die niet verwerkt kunnen worden, omdat het afhandelen te lang zou duren. Om me tegen kritiek te verweren, heb ik vaak moeten roepen: Don’t shoot the messenger."
Ook beperkingen
Vragen en selecties van de database hebben tot opvallende bezuinigingen en hoger rendement geleid. Niet alleen kon de oplage van het veertiendaagse krantje tot één derde worden verminderd, ook de respons op mailings nam fors toe. "Voorheen hadden onze mailings een gemiddelde respons van 25,3 procent, en dat is opgelopen tot 29,3 procent."
De verkooptechnieken die de Makro hanteert zijn inmiddels behoorlijk verfijnd. De onderneming is nu bijvoorbeeld in staat bepaalde groepen klanten te benaderen op basis van hun koopgedrag en hun regio via de postcode. Dat toont Cramer aan met enkele opvallende voorbeelden. "Een kleine groep klanten koopt alleen bij ons vlak voor de kerstdagen. Die groep hebben we in die periode een speciale aanbieding gedaan voor hun kerstinkopen. Een andere groep klanten koopt alle produkten bij ons, behalve wijn. Die hebben we onlangs een speciale wijnaanbieding gedaan."
Toch kent het werken met een gegevenspakhuis ook zijn beperkingen. "Het systeem is zo goed als de gebruiker. Met andere woorden, je moet wel de juiste vragen stellen. We werken nu aan datamining, waarmee we nieuwe trends kunnen opsporen. Zo kwamen we erachter dat er in een bepaalde periode veel vraag was naar voer voor puppies. Dat is te wijten aan hondenfokkers, die bij voorkeur een nest hebben in het voorjaar. Daar hebben we met veel succes een actie voor gelanceerd", aldus Cramer.
Flexibel werken
Bij de meeste grote banken in Nederland zijn nu bepaalde vormen van gegevenspakhuizen in gebruik of lopen proeven in een vergevorderd stadium. De financiële instellingen zijn echter opvallend terughoudend over de exacte stand van zaken. Zo installeerde Tandem al ruim een jaar geleden een gegevenspakhuis bij een grote bank. Deze houdt echter het reilen en zeilen daarvan strikt binnenskamers.
Bij banken kan het gebruik van een gegevenspakhuis onder andere leiden tot een lagere voorraad van de kasmiddelen en een beter inzicht in het gedrag van de klant. SAS Institute installeerde bijvoorbeeld een datapakhuis bij ANB Amro. Na invoering daarvan kon de voorraad kasmiddelen met 40 procent omlaag.
Bij de Engelse bank Barclays leidde het werken met een gegevenspakhuis vooral tot een beter inzicht in het gedrag en de wensen van klanten. In 1992 leed Barclays plotseling een fors verlies. "Het management raakte in paniek door deze slechte resultaten. We moesten iets doen. Om pragmatische redenen kozen we voor het opzetten van een datawarehouse in samenwerking met NCR", zegt Geoff Horn, directeur informatietechnologie van Barclays. "In 1992 was het voor de bank een vraagteken waarom de resultaten plotseling zo slecht waren. Uit een onderzoek onder onze klanten kwam naar voren dat we te lang op dezelfde manier werkten. De klanten verlangden meer van ons. Omdat ze dat extra bij andere banken wel kregen, raakten wij ze als klant kwijt."
Om beter op de verlangens van klanten te kunnen inspelen, besloot Barclays een datawarehouse op te zetten. "Het grote probleem was dat we de vulgegevens moesten halen uit honderden verschillende databases", vertelt Horn. "Voor het opzetten van een gegevenspakhuis, dat we hebben verwezenlijkt in een Teradata-database, waren we gedwongen die gegevens te schonen. Vervolgens werd het pakhuis gesplitst in een aantal mis-databases (managementinformatie-systeem). Daarvan werden databases afgeleid voor individuen en werkgroepen. Deze werden via tabellen geëxporteerd naar business-servers. Zo krijg je diverse datamarts. De gebruikers kunnen deze benaderen op Windows NT-servers met de opvraagtaal SQL. Op deze manier kunnen de gebruikers flexibel werken, terwijl wij het pakhuis centraal kunnen beheren, zodat de integriteit van gegevens in de afgeleide datamarts gegarandeerd is."
Talloze definities
Terugblikkend op de turbulente periode stelt Horn dat hij veel heeft geleerd van het opzetten van een gegevenspakhuis. "Het is van wezenlijk belang dat je het eens bent over de definitie van een datawarehouse. Er doen talloze definities de ronde, maar een eenduidige ontbreekt."
Horn legt er de nadruk op dat de nodige durf vereist is. "De technieken voor het opzetten van een gegevenspakhuis zijn er. De terminologie is er ook, maar je kunt niet teruggrijpen op eerdere ervaring of je spiegelen aan praktijkvoorbeelden. Er zijn opvallende successen, zoals Wal Mart, maar dat is toch een heel andere branche dat de bankwereld."
In de praktijk heeft Horn ook met tegenwerking te maken gehad. "Veel applicatie-ontwikkelaars hebben een hekel aan datawarehousing, omdat ze onder druk worden gezet door managers van business-eenheden. Die komen met eisen met betrekking tot nieuwe applicaties, die ze nodig hebben om de concurrentie voor te zijn. Daardoor staan de ontwikkelaars onder druk van de zakelijke gebruikers, en dat zijn ze niet gewend."
Hoewel Barclays wèl vaart bij het werken met een gegevenspakhuis, heeft het ook nadelen, zo erkent Horn. "Het is een project dat nooit af zal zijn. Gebruikers komen steeds met nieuwe eisen. Dat is te begrijpen, maar het vereist van de automatiseerders wel een flexibele instelling. Dat heeft in de praktijk ook zijn grenzen, zodat we weleens nee moeten zeggen." Voor de automatiseerder Horn heeft het werken met een gegevenspakhuis ook een andere houding tot gevolg. "Bij de oude manier van werken wist ik precies welke applicaties er draaiden en op wat voor manier. Nu onttrekt zich dat aan mijn waarneming. Zolang ik hoor dat de gebruikers tevreden zijn, is me dat om het even."
Miljoeneninvesteringen
Tot nu toe gebruiken vooral grote ondernemingen een gegevenspakhuis. Marktleider NCR heeft een geïnstalleerd park van vierhonderd datapakhuizen. Bij de helft gaat het om bedrijven uit de Fortune-lijst van de vijfhonderd grootste ondernemingen. "Het gaat inderdaad meestal om miljoeneninvesteringen, die alleen haalbaar zijn voor grote ondernemingen", beaamt Edward Heukels, president van NCR voor Noord-Europa.
Om de voordelen van een gegevenspakhuis binnen bereik te brengen tegen een aanzienlijk lagere investering, is NCR met het zogenoemde ‘Scalable Data warehouse’ begonnen. Voor een bedrag van 60.000 gulden krijgen gebruikers de beschikking over een datapakhuis dat geschikt is voor een afdeling, waarbij NCR een implementatietijd garandeert van negentig dagen.
Volgens Heukels is Noorwegen voorloper in het gebruik van gegevenspakhuizen. "Bij de Noorse bank Sparebanken NOR is een datapakhuis in gebruik dat inspeelt op het gedrag van bezoekers. Uit observaties is gebleken dat iemand die een nummertje trekt bij zijn bank de display met de nummers die aan de beurt zijn scherp in het oog houdt. De Noorse bank heeft nu een applicatie gemaakt die snel nagaat voor welke diensten van de bank de klant die bijna aan de beurt is belangstelling kan hebben. Op basis van een ‘klantenprofiel’ krijgt hij een paar nummers voor zijn beurt een aanbieding die op zijn profiel is afgestemd. Dat kan uiteenlopen van een aanbod voor een verzekering tot een studiefinanciering voor één van de kinderen."
Continue groei opvangen
Het grootste succesverhaal van het inzetten van een gegevenspakhuis komt van Wal Mart, de grote supermarktketen in de Verenigde Staten. Deze keten voerde het gebruik van een datawarehouse door bij 2945 winkels en clubs in zes landen. Na een uitbreiding met apparatuur van NCR werd het bestaande beslissingsondersteunende systeem uitgebreid tot een database van 7,5 terabyte. Dankzij een verfijnde techniek slaagt Wal Mart erin elke winkel tijdig te voorzien van de juiste artikelen.
"Niemand anders in de industrie dan NCR is in staat ons te voorzien van de systemen die we nodig hebben om onze continue groei soepel op te vangen", zegt Randy Mott, senior vice president en chief executive officer van Wal Mart. "De Teradata-database is de krachtigste op het gebied van parallelle verwerking. De afgelopen jaren hebben we het systeem een paar keer moeten uitbreiden, en dat ging probleemloos. We zijn nu in staat 1 terabyte per uur reads and writes te verrichten, en 0,5 terabyte in de avonduren, zodat we per dag 18 terabyte verwerken. In 1995 verwerkte ons systeem meer dan 1 miljoen ingewikkelde queries."
Wim Amerongen, freelance medewerker Computable