De Sociale Verzekeringsbank heeft sinds een paar maanden een ‘datawarehouse’ operationeel. Het ontwerp van dit gegevenspakhuis en de wijze waarop de SVB het kopiebeheer heeft aangepakt, oogsten bij de deskundigen veel waardering. Het hoofdkantoor in Amstelveen wordt dan ook regelmatig bezocht door organisaties uit binnen- en buitenland. IT-manager drs Bernard Sternfeld en drs Karel van der Weg, hoofd bureau datamanagement, informeren hen dan uitvoerig over het project, dat onder andere tot doel heeft het ‘handhavingsbeleid’ te ondersteunen.
"De Sociale Verzekeringsbank is belast met de uitvoering van drie wetten: de Algemene Ouderdomswet (AOW), de Algemene Nabestaandenwet (ANW) en de Algemene Kinderbijslagwet (AKW). Ook zijn we betrokken bij de uitvoering van de remigratieregeling van het Fonds Voorheffing Pensioenverzekering", legt IT-manager Bernard Sternfeld kort de activiteiten van de SVB uit. Er werken 3700 mensen, verspreid over het hoofdkantoor in Amstelveen en 24 (straks negen) districtskantoren.
Vorig jaar keerde de SVB bijna 45 miljard gulden uit aan pensioenen en kinderbijslag. Om dat enorme bedrag te kunnen betalen, wordt jaarlijks een schatting gemaakt van de werkelijke uitgaven. Het geld wordt door middel van loonheffing ingehouden op de salarissen. In 1995 werd 33,4 miljard aan AOW-pensioenen uitbetaald aan 2.186.000 pensioengerechtigden, van wie er 123.000 in het buitenland woonden. In datzelfde jaar was 4,7 miljard gulden gemoeid met de betaling van ANW-pensioenen en uitkeringen aan bijna 200.000 weduwen en weduwnaars, terwijl aan kinderbijslag ruim 6,6 miljard gulden werd uitbetaald ten behoeve van 3.490.000 kinderen.
Om die inkomsten- en uitgavenstromen te berekenen en in goede banen te leiden, maakt de SVB sinds jaar en dag gebruik van een mainframe-infrastructuur, waarvan het hart wordt gevormd door twee Bull-mainframes van het type DPS/9000/892T. Twee Tandem Himalaya computers fungeren als de communicatiepoort naar de Bull ten behoeve van de Tandem-computers die op de districtskantoren staan opgesteld en die via een privaat netwerk zijn gekoppeld.
"Op de districtskantoren wordt momenteel een nieuwe infrastructuur ingericht. Daarvoor is dit jaar een Europese tender uitgeschreven, die Raet Systems & Services heeft gewonnen. Er worden Windows NT-netwerken aangelegd, zodat lokaal applicaties, voornamelijk ten behoeve van de kantoorautomatisering, kunnen draaien. Er komen zo’n 3500 werkstations, 50 servers en 900 printers in de netwerken te hangen. Via terminalemulatie zullen de medewerkers met de centrale systemen gaan communiceren", aldus Sternfeld. Hij acht het niet waarschijnlijk dat de inrichting van lokale netwerken het begin zal zijn van het client/server-tijdperk voor de SVB.
Ideeën over de toekomst
"De software die op het mainframe draait ter ondersteuning van de primaire processen, is in eigen beheer gebouwd en ontwikkeld. Dat kan niet anders, omdat er geen standaardpakketten op de markt beschikbaar zijn. De laatste jaren is er een forse vernieuwingsslag geweest. Het laatste deel van het nieuwe AOW-systeem wordt volgend voorjaar opgeleverd. De oudste applicatie heeft een leeftijd van acht jaar. Ervan uitgaande dat applicaties gemiddeld zo’n tien jaar meegaan, betekent dit dat we nu nadenken over een nieuwe generatie systemen", vertelt Sternfeld.
"Dat nadenken gaat gepaard met het formuleren van gedachten en ideeën over de toekomst van de sociale zekerheid. Hoe ziet deze er over een aantal jaren uit en hoe kunnen we als IT-afdeling daarop anticiperen? Buiten kijf staat dat we de komende jaren in ieder geval zeer flexibele ontwikkeltools moeten zien te vinden. Ik denk aan een object-georiënteerde ontwikkelomgeving."
"Ik betwijfel of we voor onze primaire systemen zullen kiezen voor een client/server-architectuur. Vooralsnog ligt het tenminste niet in de bedoeling om met gedistribueerde databases te gaan werken. Het blijkt dat in het onderliggende concept de integriteit van de gegevens niet is te waarborgen en, eerlijk gezegd, ik zie niet in hoe men dat ooit voor elkaar zal krijgen. Voor de SVB zal het mainframe de centrale bedrijfsserver blijven. En bovendien, waarom zou je zoveel moeite doen om een decentrale structuur op te zetten als er een goede centrale infrastructuur ligt? De netwerktechnologie ontwikkelt zich zodanig dat de prijs/prestatie-verhouding van de netwerken steeds beter wordt."
Geen dag te laat
De SVB zit overigens nog met een ander gegeven, dat de overstap naar een volledig andere infrastructuur en architectuur moeilijk maakt: de applicaties zijn geschreven in Cobol voor een leveranciersspecifieke mainframe-omgeving. "Ga ja alles volledig opnieuw ontwikkelen, dan kost dat een vermogen en zoveel inspanning dat er tijd noch geld overblijft om nieuwe zaken op te pakken", aldus Sternfeld.
"Daarbij komt dat de lopende processen beslist op geen enkele manier verstoord mogen worden. Veel mensen die van ons geld ontvangen, zijn op die financiële bijdrage aangewezen. Is de betaling een dag te laat, dan komen sommigen van hen in de problemen. Bij al onze beslissingen die we op IT-gebied nemen, speelt die sociale component een belangrijke rol. Als we zouden besluiten om volledig nieuwe systemen te ontwikkelen, gaan we een transitieperiode in die vele jaren in beslag zal nemen. Het risico dat er in die tijd iets misgaat, is levensgroot aanwezig." Als voorzitter van de internationale gebruikersvereniging is Sternfeld intensief betrokken bij het overleg met de Bull-directie over de vraag hoe de leverancier ten behoeve van de mainframegebruikers een brug kan slaan naar een meer open omgeving.
Vanwege de aard van de organisatie zal de SVB niet snel met nieuwe technieken en technologieën gaan experimenteren. "Wij zijn geen koploper. Gelukkig, zou ik zeggen. Stel dat we met de client/server-trend waren meegegaan. Dan zouden we nu grote problemen hebben gehad. Wel proberen we van alle ‘goodies’ het beste te selecteren. Bijvoorbeeld op het gebied van datawarehousing. We hebben op basis van een IBM SP/2 met tien nodes en DB/2 PE (Parallel Edition) nu een datawarehouse-applicatie operationeel, waar internationaal veel belangstelling voor bestaat." De applicatie wordt gebruikt om statistische informatie te genereren ten behoeve van de interne controledienst en de wetgever. Ook wordt op deze wijze informatie uit de operationele systemen geanalyseerd ter ondersteuning van het handhavingsbeleid.
Opmerkelijke verbanden
De SVB wil niet roekeloos omspringen met het geld dat haar is toevertrouwd. Mensen die erop uit zijn meer te krijgen dan waar ze recht op hebben, moeten worden aangepakt. De automatisering helpt bij het uitvoeren van het handhavingsbeleid. "Dat is een van de redenen waarom we een gegevenspakhuis hebben ingericht", zegt Karel van der Weg, hoofd van het bureau datamanagement. Het doel daarvan is om opmerkelijke verbanden te ontdekken tussen de gegevens uit onze eigen systemen. Voorheen maakten we een download van een dataset uit de operationele systemen naar een PC om de gegevens te analyseren. Echter, de tools die daarvoor op de markt zijn, blijken toch te beperkt. Er was een grote vraag uit de organisatie om betere gereedschappen beschikbaar te krijgen."
Van der Weg wil geen voorbeelden geven van de inventiviteit waarmee mensen soms meer geld weten te krijgen dan waar ze recht op hebben. Wel wil hij kwijt dat de SVB de investering al ruimschoots heeft terugverdiend.
Van der Weg schrijft het succes van de gegevenspakhuis-toepassing toe aan zowel de manier waarop het pakhuis is ingericht als de wijze waarop het kopiebeheer wordt gevoerd. "Van alle AOW- en AKW-gegevens uit de operationele, hiërarchische databases maken we respectievelijk elke maand en elk kwartaal een kopie. Deze ongestructureerde en ruwe gegevens worden vervolgens tot een relationeel formaat, de zogeheten derde normaalvorm, getransformeerd. Voor het opschonen, ‘mappen’ en ‘splitten’ van de bronbestanden maken we gebruik van Prism, waarvan overigens, vanwege de slechte prestaties, bepaalde modules in Cobol’95 zijn herschreven door onze specialisten."
"We hebben er bewust voor gekozen om alle gegevens, zij het in een andere structuur, uit de operationele systemen naar de querydatabase te kopiëren. Het nadeel is dat het gegevenspakhuis behoorlijk gevuld raakt. We zitten nu op 60 Gb en elk kwartaal komt er wat bij. Dat nadeel is echter op te vangen met voldoende geheugenopslag. Daarvoor hebben we het Adsm-systeem (Adstar Distributed Storage Management) van IBM aangeschaft, dat werkt met tapes van 30 Gb per stuk. Als je bedenkt dat er tien tapes in een houder gaan, is duidelijk dat we voorlopig nog voort kunnen."
Gegevensbeheer is sleutel
Volgens Van der Weg is, naast een uiterst nauwkeurig kopijbeheer, de inrichting van de querydatabase van eminent belang voor het welslagen van gegevenspakhuis-applicaties. "De data vormen de grondstof voor de applicaties. Als die niet goed zijn, kun je de processen die je ermee uitvoert ook wel vergeten. Gegevensbeheer is daarom absoluut de sleutel. De gegevens behoor je onafhankelijk van je processen te regelen en te definiëren."
"Dat is een waarheid die overigens in zijn algemeenheid geldt", meent Van der Weg. Om die reden heeft hij, in navolging van ‘gegevenspakhuis-goeroes’, zoals de IBM-er Gus Branish, ervoor gekozen om de querydatabase niet te vullen met geaggregeerde gegevens, maar met de volledige, zij het getransformeerde, set data uit de operationele databases.
"Daarnaast hebben we tabellen, ook wel datamarts genoemd, samengesteld waarop de eindgebruikers hun queries kunnen afvuren. Daarvoor maken ze gebruik van Focus en Vizualizer. De voordelen zijn evident. De datamarts geven de inzichten en de interesses van de eindgebruikers weer, die mettertijd kunnen veranderen. Omdat we over de basisgegevens in het centrale pakhuis beschikken, is het relatief gemakkelijk om nieuwe eindgebruiker-tabellen te creëren, of om oude tabellen aan nieuwe inzichten aan te passen. Veel gegevenspakhuis-applicaties gaan de mist in doordat organisaties kiezen voor een ontwerp waarin het centrale pakhuis niet is opgenomen en dat zich concentreert op de eindgebruiker-tabellen."
Testen is belangrijk
Inmiddels heeft Van der Weg een onderzoek gestart naar het gebruik van tools voor datamining. "We bekijken of we met IBM’s Intelligent Miner nog een stap verder kunnen gaan in het onderzoek van de gegevens. Datamining is te beschouwen als een globaal proces, waarbij je niet precies weet welke informatie je uit de verzameling gegevens krijgt. We hebben inmiddels een aardige start gemaakt door een trainingsset van gevallen te beschrijven die in relatie staan tot het handhavingsbeleid. Door deze los te laten op het gegevenspakhuis, hebben we aardige classificaties weten te maken. Datamining-tools maken gebruik van intelligente zoekalgoritmes en kennen daardoor niet de beperkingen van het huidige zoekinstrumentarium. Die beperkingen zijn gelegen in het feit dat mensen de vragen moeten formuleren en de verbanden moeten leggen. Het grootste probleem is dat je in eerste instantie nooit zeker weet of de goede relaties worden gelegd."
De SVB is de eerste Nederlandse gebruiker van de tool voor datamapping Prism en van de combinatie SP/2 en DB/2 PE. Na een benchmark van een gegevenspakhuis met Tandem, IBM en Bull, is de SVB verder gegaan met IBM. Van der Weg: "We hebben ervaren dat het testen van een dergelijke applicatie uitermate belangrijk is. Het is onvoldoende om een test op kleine schaal uit te voeren. Je moet weten hoe een applicatie zich bij bulkverwerking en in een gebruikersomgeving gedraagt. Als een gegevenspakhuis-applicatie in produktie gaat, mag er geen één, of zelfs maar eentiende, bug meer in zitten. Goed gegevensbeheer is daarvoor een absolute vereiste."
Cok de Zwart, freelance medewerker Computable