Sinds mijn eerste kennismaking met het toetsenbord heb ik een uitgesproken passie voor informatie. Informatie heeft iets mystieks. Informatie is het medium waarmee wij met elkaar communiceren als substituut van de natuurlijke taal, gebaren en symbolen. Business intelligence is voor mij de ultieme zoektocht naar de 'Holy Grail' van informatie. Een wereld waarin de scheidslijn tussen techniek en functionaliteit flinterdun is en waar informatie weer subjectief en persoonlijk is en zelfs als een beleving kan worden ervaren.
Ik kan uren turen naar een datamodel, terwijl ik nadenk over de informatiebehoefte van een gebruiker. Een klein foutje in het datamodel kan namelijk grote gevolgen hebben. De context waarbinnen informatie wordt gebruikt, moet kraakhelder zijn: zowel voor de ontwikkelaar als de gebruiker. Ik verbaas me dan ook als ik presentaties zie waar het ‘geklikker-de-klik' me letterlijk om de oren vliegt. Steeds vaker stel ik me de vraag: 'Hoe is het toch mogelijk dat iemand met een enkele muisklik ook de contextuele gevolgen van die ene klik kan bevatten?' Laat staat als die ook nog eens verborgen zitten in een bij-elkaar-geklikte xml-SOA-kubus. De mogelijkheden die de ETL-DWH-BI-EAI-tools tegenwoordig bieden, zijn werkelijk legio, maar tegelijk doet het aanschouwen van de mate waarin de verschraling binnen ‘mijn' vakgebied plaatsvindt, me ontzettend veel pijn. Waar is de informaticus gebleven met passie voor zijn vak?
In de wereld van het modelleren van operationele systemen zijn we de draad al aan het kwijtraken. Tanja Ubert beschrijft dit in haar artikel 'De zin en onzin van metadata' op haar manier. Zij roept de ict'er op de taal van de gebruiker te spreken. Ik wil dit aanscherpen: laat de ict'er eerst het vak leren. Als men zich al niet eens meer bezig houdt met de semantiek van informatie, waar gaat het dan heen?
In de wereld van business intelligence zijn we losgeslagen van de aarde. Het lijkt wel of business intelligence de ‘safe haven' is geworden voor mensen die geen zin meer hebben in het modelleren van data. Zelfs al zouden ze willen modelleren, dan nog wordt ze dit ontnomen door de tools. We worden lui gemaakt, vergeten te modelleren om vervolgens oeverloos te discussiëren over het platslaan van data omwille van een KPI? Dit alles wordt dan ook nog eens versterkt door het gemak waarmee Jan en alleman alles, maar dan ook alles, aan elkaar kan breien wat los en vast zit.
Het mooie van een datawarehouse is dat je juist géén rekening hoeft te houden met processen, infrastructuur, erp-systemen en al het soort vraagstukken die je in de transactionele wereld wel hebt. Eindelijk een omgeving waarbinnen je de data mag, nee moet, modelleren zoals het hoort. Het datawarehouse moet een hemel op aarde zijn voor iedere informaticus in plaats van een vuilnisbelt van 'platgeslagen operationele data'. Wellicht begrijpelijk dat ik voorstander ben van een 'corporate information model'. Hoewel ik liever spreek over het 'correcte informatiemodel'.
In tegenstelling tot wat veel BI-experts doen geloven, ben ik dan ook van mening dat het datawarehouse in de meest haalbare normaalvorm moet worden gemodelleerd die er bestaat. Als het kan in de vierde. Waarom niet? Performance is de enige reden die men kan verzinnen. Zoals Rick van Lans in 2000 al in zijn artikel 'De fabel van het sterschema' aangeeft, het is onzin alles zomaar plat te slaan. Daarnaast vind ik het een soort heiligschennis. Je mag toch niet het meest expliciete geweten van de organisatie beperkingen opleggen omwille van techniek? Maar helaas, er is nog geen tool die automatisch voor je normaliseert. Tot die tijd is het nog steeds vakmanschap.
Maar hoe zit het dan met performance, vraag je je af? Daar wil ik best over praten, maar dan wel met een correct datamodel als uitgangspunt.
Om dit schrijven kracht bij te zetten is het volgende voorbeeld uitgewerkt.
Meer informatie over het genormaliseerde DWH is te vinden in mijn presentatie: 'OBIEE the rising sun'.
Ik onderschrijf de mening van Emiel voluit. Naast de beschreven klik-het-maar-in-elkaar mentaliteit merk ik in de praktijk nog een andere variant van gebrek aan vakmanschap. Steeds vaker merk ik dat men niet meer nadenkt maar gewoon taken uitvoert conform een bepaalde methodiek. Dus in algemene zin: zijn er nog ICT vakmannen en vrouwen?
Emiel,
Zoals Jaap van Rees in de jaren ’80 al zei: “De methode doet het niet”. Het pleidooi voor vakmanschap onderschrijf ik dan ook van harte. Maar vakmanschap betekent vervolgens niet dat normaliseren beter is dan platslaan. In het ene geval is het een goede oplossing, in het andere niet. Een goede vakman is in staat per keer de juiste afweging te maken.
Het voorbeeld dat je geeft vind ik daarnaast weinig overtuigend. Je stelt een situatie voor waarin naast een gedenormaliseerde kalendertabel (dag/maand) ook een genormaliseerde maandtabel in dezelfde omgeving voorkomt. Ja, als iemand zijn vak niet verstaat kan je dat zomaar modelleren maar dat heeft niets te maken met de afweging normaliseren / denormaliseren. Bovendien wordt het probleem dat je laat zien eerder veroorzaakt door het gebruik van surrogate keys waardoor je appels met peren kan joinen. Tenslotte is het maar de vraag of eindgebruikers zelf op tabelniveau gegevens aan elkaar gaan knopen. Daarvoor wordt hij doorgaans afgeschermd door een metadatalaag.
Beste Emiel,
Ook ik maak me grote zorgen over het vakmanschap van de ICT-er. Het kost mij als docent op het HBO veel overtuigingskracht om de jongelui te laten zien dat je met een tool nog geen vakman bent. Gelukkig lukt dat tot nu toe wel. Ook in mijn consultancy praktijk kom ik bij audits de ‘de tool doet het wel’ attitude nog te vaak tegen.
Vakmanschap geeft je juist de vrijheid om wel of niet een tool in te zetten. Om buiten de tool om te kunnen controleren of alles wel juist is. Je zet toch ook geen kleuter achter het stuur omdat ie zo leuk kan rijden met zijn Wii?
Methoden, tools, modellen, het zijn allemaal hulpmiddelen in de gereedschapskist van de vakman of vakvrouw, laten we het daar met elkaar over eens zijn. Alleen door nu al te investeren in het goed opleiden en coachen van de nieuwe ICT-ers kan het vakmanschap behouden worden.
Beste Emiel,
Ik vind het jammer dat je case voor een bedrijfsbreed (correct) informatiemodel hebt opgehangen aan de data modelleer vorm waarin dit moet gebeuren. Over dat laatste heb ik namelijk absoluut geen mening.
Wat betreft het eerst geloof ik dat de discipline die we ons hebben opgelegd binnen het financieel management, vroeg of laat ook gaat gelden en nodig is binnen het informatiemanagement (maar dan ook letterlijk: het management van informatie). Dus ja, zoals we financieel hebben leren en schrijven met grootboekrekeningen, gaat dit informatietechnisch ook gebeuren met entiteiten. Zowel geld als informatie zijn immers strategische hulpbronnen van de organisatie.
En ja, op deze discipline wordt op dit moment maar al te neerbuigend neergekeken, onder het mom van (use) case-based dan wel Agile danwel Xtreme development. Laat we ons hierdoor niet laten afleiden. Informatie is een strategische hulpbron, die gediscplineerd en soms rigide moet worden beheerst!
@ALEXANDER: het wordt inderdaad meer en meer de mens ipv de methode. Ik denk wel dat er nog voldoende vaklui zijn, maar die hebben een passie in plaats van een tool.
@WOUTER: Natuurlijk ben ik het met je eens dat je alles goed moet overwegen maar dan wel binnen de complete context. Ik ben van mening dat platslaan een laatste redmiddel is. De ervaring heeft mij geleerd dat als ik moet platslaan, ik het blijkbaar nog niet goed heb doordacht. Voor wat betreft de kalendertabel. Ik heb deze als voorbeeld gebruikt omdat ik jaren dacht dat dit de enig overgebleven dimensie was die je moest platslaan. Maar dat is ook onjuist. Ik heb onlangs dag, maand, week, jaar, kwartaal, weekdag etc tabellen los geimplementeerd voor een optimale performance en flexibiliteit. En het werkt! Wellicht had ik beter een ander voorbeeld uit kunnen werken, maar het was voor mij een eureka moment, vandaar de keuze. Maar dank je wel voor de tip.
@TANJA: Amen .. mooier kan ik het niet zeggen. Een leraar vertelde me ooit de wijze woorden: Mensen -> Werkwijze -> Methode -> Technieken en niet andersom.
@FREDDY: Middels dit artikel wil ik mensen die datamodelleren inspireren naar boven te kijken. Je hebt helemaal gelijk: een bedrijfsbreed informatie model bevat meer dat het datamodel alleen. Ik juig jouw woorden dan ook alleen maar toe.
@ALL: Dank jullie wel voor jullie reacties.