Wat is de omzet per kassa? Welk resultaat heeft die speciale verkoopactie? Lopen de personeelskosten niet uit de pas? Relevante gegevens voor een supermarktconcern als Schuitema. De winkels worden beheerd door zelfstandige ondernemers, zodat het concern hiervoor twee gescheiden datapakhuizen heeft geïmplementeerd: één voor de zelfstandige ondernemers en één voor de eigen concernstaf. Onzekere factor hierbij, tekent Robbert Hoeffnagel op, is met name de vraag welke rapportages supermarktondernemers nu precies uit het systeem willen halen. En op welk moment.
Fenomenen als ‘datawarehousing’ en ‘business intelligence’ zijn niet nieuw voor Schuitema, vertelt Arno Becker van het Business Intelligence Team van het supermarktconcern. Zo wordt er al een jaar of vier gewerkt met business intelligence-programmatuur voor het ontsluiten van gegevens die zich op het mainframe bevinden. Vsam-bestanden (virtual storage access method) worden hiertoe rechtstreeks overgezet naar een Oracle-database, om daar nader geanalyseerd te kunnen worden.
Twee jaar geleden is het concern bovendien met een project begonnen dat tot doel heeft marketingmedewerkers betere mogelijkheden te bieden om trends en ontwikkelingen te ontdekken in de grote hoeveelheden gegevens die de productiesystemen van het supermarktconcern dagelijks voortbrengen.
Inmiddels is hier een tweede datapakhuis aan toegevoegd. Opmerkelijk aan dit systeem is dat Schuitema hier zelf echter geen gebruik van kan maken. Althans, niet rechtstreeks. Dit systeem is namelijk bedoeld als hulpmiddel voor de zelfstandige ondernemers die de supermarkten van Schuitema – ruim vijfhonderd C1000- en Kopak-winkels – beheren.
Kerk en Staat
De automatiseringsafdeling van het in Amersfoort gevestigde Schuitema ondersteunt in feite twee los van elkaar staande organisaties die weliswaar nauw met elkaar verbonden zijn, maar die toch een scheiding als tussen Kerk en Staat kennen. De ene organisatie is het supermarktconcern zelf, de tweede wordt gevormd door Ecodet. Dit is de organisatie die de administratie verzorgt van de aangesloten winkels. Aangezien het concern voornamelijk werkt met supermarkten die ‘gerund’ worden door zelfstandig ondernemers zijn de gegevens die door de winkels worden voortgebracht eigendom van die ondernemers en dus niet van Schuitema.
Ecodet kan echter wel een beroep doen op de centrale it-afdeling van Schuitema voor het ondersteunen van de administratie. Voor beide administratieve organisaties heeft het concern inmiddels een datapakhuis ingericht, compleet met hulpmiddelen voor het ontsluiten van de hierin vastgelegde gegevens.
De eerste ervaringen met datawarehousing deed het supermarktconcern op binnen de eigen organisatie. "In 1999 zijn we als automatiseringsafdeling begonnen ons te oriënteren op dit soort hulpmiddelen", vertelt Becker. "De reden daarvoor was dat we uit de gebruikersorganisatie signalen opvingen die er in onze ogen op wezen dat er op niet al te lange termijn vragen over dit soort hulpmiddelen op ons af zouden gaan komen. De marketingafdeling wilde graag beter inzicht in het koopgedrag van klanten. In eerste instantie is daarom op basis van Microsoft Access een managementinformatiesysteem (mis) ontwikkeld. Dit was min of meer de voorloper van het huidige datapakhuis."
Managementinformatie
Dit mis-project bleek niet voldoende inzicht op te leveren, omdat gegevens niet op een neutrale manier werden vastgelegd, maar reeds met een bepaald analysedoel voor ogen. "We konden gegevens niet op een voldoende laag niveau opslaan. In het datapakhuis leggen we gegevens op het niveau van individuele artikelen vast. Dat vormt de basis. Willen gebruikers nader kijken naar speciale aandachtsgebieden, dan richten we daar vervolgens een speciale datamart voor in. Maar wel een ‘datamart’, gebaseerd op die basisgegevens op artikelniveau."
In feite zijn datamarts dus een moderne variant op het oude managementinformatiesysteem. Dat de gegevens in het datapakhuis haast per definitie achterlopen op of ouder zijn dan die in de productiesystemen is volgens Beckers niet zo’n probleem. Veel gebruikers hebben ook eigenlijk helemaal geen behoefte aan ‘real-time’ of ‘near real-time’ data, meent hij. Wat voor hen veel belangrijker is, is het feit dat de periode tussen het moment waarop men een vraag stelt of een analyse wil doen en het tijdstip waarop het antwoord of resultaat beschikbaar is, zo kort mogelijk is.
Een organisatie die voor het eerst met een datapakhuis aan de slag gaat, staat voor de lastige vraag hoe hiervoor een geschikte omgeving kan worden geselecteerd. Becker vertelt dat ook bij Schuitema lang over dit punt is nagedacht. Men besloot de selectie aan te pakken via het te gebruiken ETL-tool. "Met een goed gekozen hulpmiddel voor ‘extraction, transformation and loading’ van data kunnen flinke voordelen worden behaald. De gegevens die in het datapakhuis worden verzameld, zijn immers afkomstig uit productiesystemen. Veelal gaat het niet alleen om aanzienlijke hoeveelheden gegevens, maar bovendien om data die beschikbaar is in formaten die eerst bewerkt moeten worden, voordat de gegevens in het datapakhuis kunnen worden geladen. Hoe makkelijker en efficiënter dit proces verloopt, hoe meer tijd en geld kan worden bespaard."
Tweede of derde generatie?
De keuze van een geschikt ETL-tool is daarmee een afweging van de te verwachten voordelen ten aanzien van de tijd die nodig is om gegevens uit bestaande productiesystemen te halen, te converteren en te laden. Daar zijn bovendien kosten mee gemoeid, terwijl ook het beheer van dit proces een argument is dat meegenomen moet worden in de afweging.
"We werden bij deze keuze bovendien geconfronteerd met een technologische generatiewisseling. We hebben gekeken naar de Prism-achtige producten die zichzelf al een jaar of tien hadden bewezen. We hebben echter ook gekeken naar de – zeg maar – derde generatie-tools. Deze bieden het voordeel dat ze van recenter datum zijn en dus bijvoorbeeld geen Cobol-broncodes of iets dergelijks genereren, maar direct SQL. Dat gebeurt bovendien heel intuïtief door het aanklikken van functies. Je hoeft dus niet zelf te gaan programmeren en compileren om zo’n bewerkingsslag te kunnen automatiseren."
De keuze viel uiteindelijk op het derde generatie-hulpmiddel Powermart van Informatica. De onderliggende database stond bovendien al vast. "We richten ons hier standaard op Oracle. Het is dan ook die omgeving, tenzij er erg goede redenen bestaan om daar van af te wijken."
Als vrijwel geheel op Bull-hardware gebaseerde organisatie stond ook de keuze van de server min of meer vast. Toch moet de selectie van de hardware bij een datapakhuis niet worden onderschat, meent Becker. "Het bleek toch verstandig om te kiezen voor een echte datapakhuis-server. Dat wil zeggen dat met name veel aandacht is besteed aan het kiezen van de omvang van het werkgeheugen, terwijl ook de snelheid van de toegangstijden tot het schijfgeheugen belangrijk is. We hebben ook DEC/Alpha bekeken, maar zijn uiteindelijk toch voor de combinatie van Bull en Unix gegaan."
Gegevenskwaliteit
Hoe weldoordacht de technische omgeving ook mag zijn opgezet, kern van de zaak is toch welke gegevens er in een datapakhuis worden gestopt. Niet alleen gaat het dan om de vraag welke gegevens worden geselecteerd, ook de kwaliteit daarvan is van groot belang. "Data cleansing is bij legacy-systemen een ware crime", meent Becker. "Er lagen hier tal van gegevensdefinities. Maar zelfs wanneer die actueel zijn en alle gegevens afdekken, is dat nog maar de helft van het verhaal. Minstens zo belangrijk is natuurlijk de vraag hoe gebruikers met de gegevens zijn omgegaan. Het opschonen van de gegevens hebben we zelf ter hand genomen. We hebben hier echter geen standaard pakketten voor aangeschaft, maar zijn handmatig te werk gegaan en hebben waar mogelijk zelf de correctieslagen geautomatiseerd."
‘Data cleansing’ is een onderwerp dat bij ieder datapakhuis-project aan de orde komt, maar dat nog steeds onderschat lijkt te worden. Dat heeft ook te maken met het feit dat leveranciers van datapakhuis-producten het onderwerp wel noemen, maar niet altijd op een dusdanige manier dat de aandacht die dit onderwerp moet krijgen geheel duidelijk wordt.
"De problemen waar je tegenaan loopt worden bovendien sterk bepaald door de lokale omstandigheden. Duidelijk is wel dat het om een veelheid van op zich vaak kleine problemen gaat. Wordt bijvoorbeeld geschreven: ‘Amersfoort’ of is er achter die plaatsnaam per ongeluk een spatie getikt? Die ene positie extra kan een groot verschil uitmaken. En dat is dan maar één voorbeeld. Het probleem is nu natuurlijk om te ontdekken welke fouten en afwijkingen er in de vastgelegde gegevens zitten. Dat is monnikenwerk."
Om toch tot een hoog kwaliteitsniveau te komen, is binnen Schuitema een speciaal team van gebruikers en automatiseerders op dit onderwerp gezet. "Je moet er rekening mee houden dat hier veel tijd in gaat zitten. Ik schat dat bij ons de helft van de projectinspanning op dit aspect was gericht."
Doordat de productiesystemen binnen het concern leidend waren verklaard, werden de inspanningen om de kwaliteit van de gegevens te verhogen op deze informatiesystemen gericht. "Dat heeft een belangrijk bijeffect: er was al snel sprake van een groeiende bewustwording dat de kwaliteit van de gegevens die worden vastgelegd erg belangrijk is. En aangezien je aan de productiekant aan het werk bent, verbetert dus niet alleen de kwaliteit van de data in het datapakhuis, maar ook die van de gegevens die gebruikt worden in productiesystemen."
Het kiezen van de gegevens die in het datapakhuis worden vastgelegd, is een zakelijke beslissing, in dit geval gemaakt door de marketingafdeling van het concern. "Het gaat om wat wij noemen ‘achterdeuromzetten’ en ‘voordeuromzetten’ (verkopen door Schuitema aan de winkel en verkopen van de winkel aan de consument) uitgesplitst op het niveau van artikelen en productgroepen, naw-gegevens van ondernemers en marketingkenmerken van winkels en vestigingen. Dit wordt continu aangevuld met externe gegevens ten aanzien van bijvoorbeeld marktontwikkelingen, marktaandelen en degelijke."
Het concern gebruikt voor het verzamelen van gegevens onder andere het zelf ontwikkelde pakket ‘Detailhandels Automatisering’ (DA) dat de diverse kassa’s in een winkel via een lokaal netwerk verbindt met de centrale winkelcomputer. Transactiegegevens kunnen hierdoor op digitale wijze worden verzameld. Dit gebeurt één maal per week, waarna de gegevens naar Ecodet worden doorgesluisd. De leveringen van Schuitema aan de diverse winkels worden dagelijks verwerkt in het datapakhuis van de organisatie.
Voordeuromzet
Dit eerste datapakhuis werd een jaar geleden in gebruik genomen. Hoewel de omgeving ontwikkeld was voor de centrale marketingafdeling van Schuitema ontstond al snel bij andere afdelingen belangstelling voor het op deze wijze gebruiken van gegevens, vertelt Beckers. "De afdeling Vastgoed kijkt bijvoorbeeld met belangstelling naar de manier waarop dit soort gegevens en systemen gebruikt kunnen worden bij het plannen en beheren van gebouwen."
Ook Ecodet bleek belangstelling te hebben. Hier was men vooral gecharmeerd van het idee om de ondernemers een betere inzage in het financiële reilen en zeilen van de eigen vestigingen te geven. "Met de ervaring die we met dit interne Schuitema-systeem hebben opgedaan, was het voor ons niet zo vreselijk moeilijk om ook voor de ondernemers een datapakhuis te creëren. De benodigde gegevens waren beschikbaar, de vraag was alleen wat men precies wilde weten. En – heel belangrijk – hoe we de distributie van de rapportages zouden aanpakken."
Ecodet maakt net als Schuitema gebruik van Oracle Financials als financieel systeem. Deze twee systemen zijn geheel gescheiden, zodat het tweede datapakhuis rechtstreeks op Oracle Financials kon worden gebouwd. Aangezien nog niet precies duidelijk is welke gegevens de ondernemers willen gebruiken, koos Ecodet voor zo’n 25 standaardrapporten met ieder circa één A4-tje aan gegevens.
"De vraag is natuurlijk wanneer ondernemers deze gegevens nodig hebben? We kunnen prints maken en die versturen, maar dat kost tijd en ‘handling’. Bovendien weten we uit ervaringen met het op digitale wijze plaatsen van bestellingen dat er grote verschillen zitten in de manier waarop zij hun eigen activiteiten organiseren. Wie schetste bijvoorbeeld onze verbazing toen we op een gegeven moment ontdekten dat sommige bestellingen om 04.00 uur in de nacht worden doorgestuurd! Daarom hebben we besloten om het moment waarop de ondernemers de gegevens willen gebruiken geheel aan hen zelf over te laten."
Winkelondernemers die meedoen aan de proef die momenteel rond dit datapakhuis loopt, loggen in op een speciale webserver van Schuitema. Nadat zij zichzelf hebben aangemeld, kunnen zij vervolgens één of meer standaardrapportages opvragen. Daarvoor gebruikt het concern het product Web Intelligence van Business Objects, dat de rapportagehulpmiddelen van deze firma voorziet van een webinterface.
Op zich is dit een redelijk eenvoudige procedure, ware het niet dat er toch wat opmerkelijke aspecten aan het licht kwamen. Becker: "Het is nu nog een proefproject, maar wat gebeurt er wanneer straks alle vijfhonderd ondernemers tegelijk om 09.00 uur gaan inbellen? We hebben geen duidelijk beeld van het moment waarop men dat zal gaan doen. Bovendien ‘lokt’ het beschikbaar stellen van dit soort gegevens via internet ook als het ware een gedrag uit waarbij men vaker en op zelf te bepalen tijdstippen rapporten gaat opvragen. Web Intelligence functioneert het beste wanneer er niet meer dan veertig of vijftig processen tegelijk lopen. Technisch hebben we daarom wat maatregelen genomen om te voorkomen dat straks lange wachttijden ontstaan wanneer inderdaad ‘iedereen’ op hetzelfde moment inbelt. We laten bijvoorbeeld speciale tabellen één-op-één meelopen met de standaard rapporten."
Oppassen
Een eerste groep van ondernemers kan nu via de webinterface rapporten opvragen. "We volgen dat proces nauwkeurig, zodat we een beter beeld krijgen van de momenten waarop gegevens worden opgevraagd, welke rapportages vooral gebruikt worden en dergelijke. We hebben samen met Ecodet dan ook bewust gekozen voor het gebruik van voorgeprogrammeerde ‘queries’. Zeker in het begin zullen gebruikers immers geen idee hebben van de technische gevolgen van sommige zoekacties. Wat vanuit de positie van zo’n winkelmanager wellicht een volstrekt normale vraag is, kan technisch gezien een systeem misschien wel op de knieën dwingen door het enorme beslag dat de aanvraag op de verwerkingscapaciteit legt."
De twee datapakhuis-omgevingen die Schuitema nu in gebruik heeft, hebben volgens Becker belangrijke voordelen gebracht. "Het is volstrekt duidelijk dat er een flinke tijdwinst is gemaakt. Wanneer vragen één voor één geprogrammeerd moeten worden voordat een rapportage kan worden gemaakt, kost dat veel tijd. Is het antwoord dat uiteindelijk boven water komt, dan eigenlijk nog wel relevant? Je kunt nu sneller en beter rapporteren en bovendien meer. Daardoor ontstaat een beter beeld van de operatie en kom je meer te weten van het gedrag van klanten."
Toch moet er voor gewaakt worden dat de resultaten van analyses van in een datapakhuis verzamelde gegevens geen eigen leven gaan leiden. "Het wordt bij ieder datapakhuis genoemd, maar het risico blijft bestaan: de gegevens die je eruit haalt zijn zo goed of zo slecht als de data die je erin stopt. Daarbij gaat het dus om data cleansing-achtige onderwerpen, maar ook over de vraag wat gebruikers eigenlijk doen met de gegevens die zij invoeren."
Dat punt is minder academisch dan het misschien lijkt, meent Beckers. "Een ogenschijnlijk nooit gebruikt veld in een database kan gemakkelijk door eindgebruikers voor een onderling gekozen, maar geheel niet officieel doel worden gebruikt. Er zijn legio voorbeelden van gevallen bekend waarbij de ene afdeling een veld op informele wijze en uitsluitend voor interne doeleinden gebruikt, terwijl een andere afdeling meent dat deze registratie wel degelijk officieel is. Dat dit tot grote fouten en problemen kan leiden, zal duidelijk zijn."
Robbert Hoeffnagel Freelance Medewerker
Schuitema
Supermarktconcern Schuitema telde in het jaar 2000 ruim 550 winkels. Afgelopen jaar werd bovendien A&P overgenomen, dat bestaat uit 125 supermarkten. Deze winkels worden in de loop van 2001 omgebouwd naar de C1000-opzet.
Alle winkelformules hadden in 2000 een gezamenlijk marktaandeel in Nederland van 14,8 procent. Dat was in dat jaar goed voor een omzet van 2,68 miljard euro. De winst kwam uit op 29,6 miljoen euro. Het resultaat na belastingen bedroeg daarmee 1,4 procent van de omzet. Deze smalle marge verklaart het adagium van Schuitema dat alles draait om ‘omzet, winst en marktaandeel’.
Het zijn ook diezelfde geringe marges die het gebruik van hulpmiddelen als datapakhuizen interessant en nuttig maakt. Meer inzicht in gerealiseerde verkopen en een groter vermogen om consumentengedrag te kunnen inschatten, hebben relatief gezien een grote invloed op de financiële resultaten van het concern. Dat geldt voor de beslissingen die op concernniveau worden genomen, maar ook voor de keuzes die de zelfstandige winkelondernemers maken.