Hoe meer data er relationeel in een database zit, hoe meer je er mee kan doen. Althans, dat dachten we zo’n tien jaar geleden. Latere inzichten rondom het dimensioneren van data stelden dat beeld wel wat bij: om echt iets met data te doen dat verder gaat dan platte rapportage, zou je de data in een datawarehouse moeten gooien. Nou ja, de rest is historie. De prachtigste rapportages en analyses kunnen we maken onder de noemer bi.
Ik las een stukje over Endeca. Endeca is een softwareleverancier van Information Access-tools, eigenlijk net als Autonomy, Microsoft (Fast), Coveo en anderen. Vroeger omschreef Gartner deze leveranciers als Enterprise Search, maar daar zijn ze inmiddels overheen gegroeid. Endeca stelt:
- 1. The relational database was built for transactions
- 2. Business intelligence was built for reporting
- 3. Enterprise Search was built for document retrieval
Information Access Technology is inmiddels als stroming al een paar jaar flink onderweg, compleet met Gartner-kwadrant. Maar wat gebeurt er nou eigenlijk als je aan de slag gaat met met Information Access-techniek? Er worden talloze bronnen (repositories) geïndexeerd. Dit gebeurt (meestal) met een zoekmachine en eventueel wat metadata. Zo'n search engine laten we een crm-systeem ingaan, een aantal velden meenemen (en liefst ook de tekstinformatieblokken van klanten), we laten vervolgens de engine door documenten (in uw ecm als Sharepoint) heen crawlen, door de e-mail, door de archieven en met een beetje slimme opzet hebben we een interessante bak met allerlei data waar we op een aardige manier doorheen kunnen surfen. Liefst op de Google-manier: 'winst 2008 fietsonderdelen Amerika'. Wat we dan krijgen laat zich raden. Niet zozeer de grafiek (of als deze 'getagt' was wel natuurlijk), maar wel de bron waar deze informatie staat, die we even kunnen bekijken (als de autorisatie dat toelaat). Niet dat ik nu wil discussiëren over of dit een handige manier is om informatie boven water te krijgen, of dat we dit toch beter met een bi-pakket met een e-mailverzendlijst kunnen delen, maar ik wil ons de vraag voorleggen wat we met deze gecreëerde bak met data zouden kunnen doen! Een soort datawarehouse waar we straks allerlei cubes voor kunnen bouwen. Die cubes heten overigens bij alle softwareleveranciers vaak nog anders (facets – Coveo, guided summarizing queries – Endeca), maar ze geven een interessante manier van kijken naar data. En dat is allemaal begonnen met het 'searchen' naar documenten. Het kan dan ook niet lang meer duren voordat we de meest prachtige rapportages kunnen maken van de doorsnedes van deze Data-Bins. Mee eens?
Maar wat is nu de bottom line? Als we de buikriem weer aan moeten halen, dan sneuvelen er nogal wat klassieke business intelligence-projecten. Resultaten uit het verleden geven een voorspelling van de toekomst, zullen we maar denken: veel projecten waren duurder dan gepland, duurden langer en brachten minder op. Information Access, volgens mijn opinie een stevige bi-dimensie, levert een solide business case: door het indexeren van verschillende repositories reduceert men het dagelijks zoeken van de kenniswerker (en hoeveel hebben we er daar wel niet van?) met zeker 10 to 15 procent per dag. Test maar eens hoeveel tijd je spendeert per dag naar het zoeken van die attachment in de e-mail of dat document met de derde versie van een contract en het laatste persbericht van de klant die we morgen gaan bezoeken. Nog weinig intelligent? Combineer dan eens wat gegevenstypes (klant-betalingsgedragcode-contracten) voordat er gecrawled en geïndexeerd wordt naar de Data-Bin. Geen mooie output? Zet de data eens overzichtelijk in een persoonlijke portal. Kortom, als het allemaal wat minder gaat met de wereldeconomie, kan deze bi qua efficiency een heel verschil maken en voorzie ik een schitterende toekomst voor Information Access Technology die de klassieke wereld van bi gaat aanvullen. Maar daar hoeft u het niet mee eens te zijn. En dat hoor ik graag!
Andries Bottema
BI Ambassador en CiC Netwiz
Information Access (Enterprise Search) is iets moois. Het gaat verder dan zoeken en vinden van (actionable) informatie. Denk aan de mogelijkheden ten aanzien van restrictie (governance) of de link leggen naar reporting (klassieke BI).
Ja, er staan ons nog een hoop interessante ontwikkelingen te wachten. Natuurlijk is het mooi wanneer een kenniswerker intuitief op zoek kan naar antwoorden op vragen zonder zich af te vragen of de bron gestructureerd is of ongestructureerd (of nog moeilijker, gestructureerd is geworden door slim gebruik van besproken tooling).
Echter, een succesvolle organisatie onderscheidt zich niet alleen door het succesvol inzetten van deze tooling. Belangrijk(er) blijft het om duidelijkheid te hebben in de organisatie- en daarvan afgeleide procesdoelstellingen. Met andere woorden, wanneer we vergeten het verschil tussen de zoekopdracht “winst 2008 fietsonderdelen Amerika” en “winstdoelstelling 2008 fietsonderdelen Amerika” te maken dan missen we een, klein maar belangrijk, onderdeel.
Maar wat zijn het mooie ontwikkelingen …
Ik vraag me altijd hoeveel dit soort toepassingen nu echt toevoegen aan bijvoorbeeld desktopsearch, of een regulier CRM-pakket. Ja je kan natuurlijk op een aantal punten geintegreerder zoeken, maar voorwaarde daarvoor is dat je dat hebt ingericht. Ik vraag me dan af of de kosten en het onderhoud opwegen tegen de baten (en niet alleen in geld uitgedrukt).
Onmiskenbaar is er druk in de markt om hiermee bezig te zijn en besluiten ter inplementatie zijn niet altijd rationeel. Ik ben het wel met Andries eens dat dit waarschijnlijk de eerste projecten zijn die zullen sneuvelen in een slechter economisch klimaat.