Overbelasting door teveel informatie staat de laatste tijd flink in de belangstelling, en met de opkomst van het intranet wordt het alleen maar actueler. Immers, een intranet is per definitie een informatieverspreider. Maar als de gebruikers de mogelijkheden van een intranet ontdekken, is het gevaar niet denkbeeldig dat zij in de euforie alle bedrijfsinformatie op één grote hoop gooien. Vier consultants van de DTO, de Defensie Telematica Organisatie, introduceren zoeksleutels die passen op alle sloten.
Na een jarenlange worsteling om het automatiseren van gestructureerde gegevensverzamelingen onder de knie te krijgen, is het nu de beurt aan systemen met beperkt gestructureerde gegevensverzamelingen. Het intranet lijkt een nieuwe drager te worden voor de ontsluiting van dit type informatie.
Elk bedrijf kent het fenomeen van komende en gaande medewerkers – met voor de organisatie waardevolle kennis. Zit deze kennis slechts in de hoofden van deze medewerkers, dan heeft de organisatie daar geen baat bij. Pas met ‘kennismanagement’ is deze waardevolle informatie te ontsluiten: de waarborg dat de juiste informatie of kennis aanwezig is, maar ook teruggevonden kan worden. Kennismanagement is de komende jaren een belangrijk onderwerp voor informatie- en kennisintensieve organisaties.
Informatie en kennis zijn uitgegroeid tot belangrijke productiefactoren. De fysieke vorm openbaart zich als de gegevens, en als deze gegevens relevant zijn in een bepaalde context is er sprake van informatie. Zo is een belangrijk aspect van kennismanagement een informatie-‘voorziening’-vraagstuk waarbij het gaat om de beschikbaarheid en de ontsluitingsmogelijkheden van informatie. Hierbij is het noodzakelijk om het gehele informatiespectrum in ogenschouw te nemen: van bedrijfsnieuws tot bedrijfskennis.
Een troebele markt
Om informatie op een intranet te ontsluiten wordt vaak van een search engine gebruik gemaakt. Nu bestaan search engines al veel langer dan het fenomeen intranet, zij het onder de naam information retrieval systems (irs). Leveranciers van deze systemen zien brood in de enorme markt die met de aandacht voor het intranet is ontstaan, en bieden vrijwel allemaal Internet- en intranet-versies van hun producten aan. Deze markt is echter ondoorzichtig geworden.
Vanuit een expertise, opgebouwd met op ‘information retrieval’ gebaseerde oplossingen van kennismanagement en ‘push’-functionaliteit, hebben wij de huidige stand van zaken tegen het licht gehouden. Daarnaast zijn een aantal modellen ontwikkeld die gebruikt kunnen worden bij het ontwerpen en implementeren van een geïntegreerde oplossing van de informatievoorziening op basis van een intranet. Eén model lichten wij in dit artikel toe.
Bij het verkennen van de information retrieval-markt hebben wij ons beperkt tot de belangrijkste spelers, zoals die ook door Gartner Group (Jim Bair, Gartner Group 1996) zijn geïdentificeerd. De search engines die ook op het Internet gebruikt worden, zijn bewust buiten beschouwing gelaten. Deze producten vinden wij te beperkt van functionaliteit om ingezet te kunnen worden voor bedrijfskritische toepassingen, of om deel uit te kunnen maken van de infrastructurele voorzieningen.
Vijf information retrieval-systemen werden onder de loep genomen: Search ’97 van Verity, Oracle Context Search, Excalibur (EFS), Search Server van Fulcrum Technologies en Personal Library System van PLS Incorporated. In welke mate deze systemen de noodzakelijke functionaliteit bezitten, wat de onderscheidende functies zijn en hoe de levering en support in Nederland zijn georganiseerd, waren de voornaamste punten van het onderzoek.
Van één van de belangrijke mededingers, Fulcrum, kregen wij te weinig medewerking om het product serieus te kunnen beoordelen. Kenmerkend is overigens dat Fulcrum nauwelijks in Nederland wordt ondersteund, terwijl het wereldwijd gezien een van de sterkste marktpartijen is.
Komische cultuur
Vergelijking van deze zoeksystemen (irs’en) is niet eenvoudig. Het tegen elkaar uitzetten van de kenmerken van de verschillende producten bleek een vrij zinloze exercitie. Ogenschijnlijk is er niet veel verschil in het aanbod, maar als de mogelijkheden wat beter bekeken worden, blijkt dat zij niet altijd van gelijke orde zijn. De leek die een pakket wil selecteren, zal naar ons idee in opperste verwarring geraken. Na een rondje langs de leveranciers – een komische ervaring – lijkt het tot de cultuur te behoren om als belangrijkste verkoopargument de zwakte van de concurrentie te noemen.
De door ons beproefde producten zijn stuk voor stuk goed en de basiskwaliteiten komen in grote lijnen overeen. Dat wil echter niet zeggen dat voor elke situatie een willekeurig pakket voldoet. Dat bijvoorbeeld met fuzzy search gezocht kan worden zegt op zich niets. Belangrijk is het nut dat deze wijze van zoeken kan hebben in een specifieke situatie. Het heeft als voordeel dat documenten met spellingvarianten en -fouten toch gevonden kunnen worden, maar ‘fuzzy search’ veroorzaakt ook ruis. Bij complexe queries kan de vervuiling onacceptabel groot worden. Ruis maal ruis geeft mega-ruis.
Implementatie verschilt
Daarnaast is de implementatie van de features niet gelijk. Concept search bij Search ’97 van Verity is een heel ander verhaal dan deze zoekwijze bij de andere producten. In het product van Verity kunnen concepten bestaan uit complexe queries, waarbij aan de samenstellende delen waarde toegekend kan worden. Bij andere producten gaat het niet veel verder dan het bewaren en hergebruiken van reeds gemaakte queries. Belangrijk is dat concepten een belangrijke rol kunnen spelen bij het effectief inrichten van een op interesseprofielen gebaseerde ‘push’-functie. In een enkel geval onderscheidt een product zich werkelijk.
Zo werkt Excalibur als enige op basis van patroon- in plaats van karakterherkenning. Als er met grote hoeveelheden ‘images’ gewerkt wordt kan dit een belangrijk pluspunt zijn. Wanneer eenvoud van het gebruik zwaar weegt, dan is PLS bijvoorbeeld een sterke partij door een hoge mate van interactie bij het formuleren van de zoekvraag.
In deze marktverkenning werd niet de technische architectuur van de pakketten meegenomen. De meeste serieuze pakketten (de door ons onderzochte) zijn gebaseerd op een client/server-architectuur en zijn inzetbaar in een intranet. De verdere technische mogelijkheden, zoals de indexeersnelheid, -capaciteit en -methode, de response-snelheid bij simpele en complexe queries en de achterliggende linguïstische technologie hebben wij niet kunnen onderzoeken.
Toekomstgericht model
Het is opvallend dat noch de kopende, noch de verkopende organisaties -bij lange na niet- de mogelijkheden van de information retrieval-producten uitbuiten. De voordelen van information retrieval komen pas echt aan bod als integratie geschiedt met de totale informatievoorziening. Voorkom dat slechts een deelprobleem wordt opgelost. Vanuit dit perspectief moet dit middel worden ingezet om alle relevante bedrijfsinformatie te ontsluiten.
Deze visie hebben we in een toekomstgericht model gegoten. Wij zijn hierbij uitgegaan van twee belangrijke invalshoeken. Als eerste moet de gebruiker geconfronteerd worden met een eenvoudige en eenduidige interface. De tweede belangrijke invalshoek is dat het model is gebaseerd op informatie. Val de gebruiker niet lastig met de fysieke opslagmedia die zijn gebruikt om de informatie op te slaan. Ook moet hij niet geconfronteerd worden met verschillende interfaces om de informatie boven water te krijgen. Houd deze zaken voor de gebruiker transparant.
De lagen tussen de gebruikersinterface en de informatie dienen slechts om de gebruiker efficiënt met informatie te laten omgaan. In het model is de integratie van de totale informatievoorziening weergegeven. Kantoorautomatisering, formele systemen en documentaire informatievoorziening zijn elkaar aanvullende en ondersteunende componenten.
Internet als bindmiddel
Het ligt voor de hand dat Internet-technologie als samenbindend middel wordt gebruikt. Natuurlijk is dat laatste geen noodzaak, maar het maakt het wel eenvoudiger. Door middel van data-management en gateways kunnen koppelingen gelegd worden naar databases. Niet alle producten bieden hier voldoende en krachtige functionaliteit. Voor de informatiewerkers of eindgebruikers is het overigens niet van belang of informatie hoog of laag gestructureerd is; als zij maar relevant is. De meest voor de hand liggende ontwikkeling is dan ook dat de ontsluitingstechnieken voor gestructureerde systemen en ongestructureerde informatie naar elkaar toe zullen groeien.
Het model pretendeert geen compleet beeld van de werkelijkheid te schetsen. De essentie schuilt in enkele eenvoudige uitgangspunten: de basis van het model wordt gevormd door informatie, en de gebruiker bepaalt de invalshoek. Allerlei technologische zaken moeten zo transparant mogelijk worden gemaakt.
Hier komt de Internet-technologie om de hoek kijken. Information retrieval is essentieel, het regelt de toegang tot alle informatie. Tevens ligt hier de basis voor de ‘push’-functionaliteit: een van de sleutels om het vraagstuk van de ‘information overload’ op te lossen. Op basis van interesseprofielen kan deze functionaliteit informatie naar de gebruiker brengen.
Kiezen geen sinecure
De mogelijkheden van information retrieval-producten worden lang niet altijd ten volle benut, maar daar staat tegenover dat deze ook niet alle nodig zijn. Niet elk informatievraagstuk vereist ook een oplossing zoals die in ons model is opgenomen. De implementatie van op information retrieval-technologie gebaseerde oplossingen, waarbij de ontsluiting van àlle bedrijfsinformatie van belang is, vergt bijzondere aandacht.
Ervaringen hebben uitgewezen dat het niet zo eenvoudig is om kenniswerkers hun informatie te laten delen. Kennis is nog steeds macht. Nieuwsberichten en officiële publicaties veroorzaken geen problemen. Staat de informatie evenwel verder van de informatiewerker af, dan ontstaan er minder problemen bij het delen van die informatie. Zo leveren adviesrapporten of beleidsnota’s vaak wel problemen op. Het is van belang dat er een cultuur van openheid ontstaat. Dit gebeurt echter niet vanzelf. Pas als de voordelen van het gemeenschappelijk gebruik van informatie evident zijn, kunnen de vruchten worden geplukt.
Veel leveranciers bieden information retrieval-producten aan, wat de juiste keuze niet vereenvoudigt. Producten moeten niet alleen worden beoordeeld op basis van verschil in prestatie of functionaliteit. Ook de degelijkheid van de leverancier en zijn capaciteit om ontwikkeling en invoering van deze systemen actief te begeleiden moeten worden meegenomen. Voor bedrijfskritische en grootschalige toepassingen weegt dit argument zwaar. Naast de keuze van het product is ook aandacht vereist voor de implementatie-aspecten. Het implementeren en installeren van deze technologie is geen sinecure.
Het intranet leent zich uitermate goed om information retrieval in te bedden. Om optimale ondersteuning van de bedrijfsprocessen te behalen moet deze technologie worden opgenomen in de informatie-architectuur. Naar onze mening is information retrieval uiterst noodzakelijk in de informatievoorziening en kan het een oplossing betekenen voor menige organisatie.
Rink de Haan (managing consultant),
Marc de Barse,
Jacob van de Graaf en
Tjalling Vonk.
Allen zijn werkzaam bij de Defensie Telematica Organisatie (DTO).
De Praktijk
Belangrijker dan de specificaties van de producten zijn de implementaties ervan. Wij hebben via de leveranciers enkele organisaties bereid gevonden hun implementatie van specifieke information retrieval-systemen te demonstreren en toe te lichten. Een beperkte bloemlezing uit deze ervaringen.
City Online
City Online (www.city.nl) is een professioneel opgezette communicatie-, nieuws- en informatiedienst op Internet. De opzet is sterk lokaal en regionaal georiënteerd en richt zich op gebruikers uit desbetreffende stad of regio. De steden bieden vooral regionale informatie en onderlinge contactmogelijkheden. City Online is een gezamenlijk initiatief van Wegener-Arcade en VNU Dagbladen Groep. Momenteel zijn de steden Apeldoorn, Den Haag, Deventer, Eindhoven, Heerlen, Maastricht, Nijmegen, Rotterdam, Tilburg en Utrecht ‘online’. In de loop van 1997 volgen nog vijftien andere steden in Nederland.
De aflevering van specifieke informatie aan individuele gebruikers vormt een belangrijk onderdeel van het concept van City Online, ook bij grote aantallen bezoekers. Omdat de informatie in diverse formaten wordt opgeslagen in de onderliggende Oracle-databases en de html-pagina’s dynamisch worden gegenereerd, was een systeem nodig om diverse bronnen en dataformaten van de informatie simultaan te indexeren en te ontsluiten. City Online koos hierbij voor Personal Library System (PLS). Van belang hierbij was dat het aantal handelingen van de beheerder van de site tot een minimum werd beperkt, mede door de dynamische koppeling tussen de Oracle- en de PLS-omgevingen en door de intelligente zoektechnologie van PLS zelf, waarvoor geen extra (handmatig) onderhoud van thesaurus en dergelijke nodig is.
Peter Maronier, directeur City Online is heel erg positief: "Wij hadden een flexibele oplossing nodig die de juiste informatie, afhankelijk van de diverse behoeftes, bij onze gebruikers bezorgde en tegelijkertijd binnen onze Oracle/Livewire-omgeving paste. PLS werkte met ons samen om al snel een ideale oplossing te ontwerpen en realiseren."
Buitenlandse Zaken
De Dienst Documentaire Informatievoorziening van het ministerie van Buitenlandse Zaken houdt onder andere een facturenadministratie bij. Nieuwe facturen worden op papier aangeleverd. De historie ligt grotendeels opgeslagen op microfiche. Handmatig terugvinden van bijvoorbeeld een bepaalde factuur is een crime. In deze situatie komt verandering met behulp van een online systeem. De facturenadministratie omvat ruim 30.000 facturen. Deze facturen, historisch en nieuw, worden gescand. Na ‘optical character recognition’ vindt indexering plaats.
Voor het zoeken naar de gewenste factuur gebruikt het ministerie Retrievalware van Excalibur. Er is een testomgeving ingericht volgens de nieuwe situatie, echter met een beperkte hoeveelheid documenten. De testresultaten bij het gebruik van fuzzy search zijn bevredigend, met name in response-tijd en zogenoemde ‘relevance’. De praktijk moet uitwijzen of deze resultaten bij grotere aantallen documenten ook zo goed zijn. Ook bij andere toepassingen, zoals elektronische post, wordt uitsluitend op tekst gezocht. Het ministerie gebruikt dus niet de faciliteiten waarmee de leverancier zich juist manifesteert, zoals het zoeken in images.
Het installeren van Retrievalware vond men niet echt eenvoudig. Bij het instellen van de parameters is dus ondersteuning wenselijk. Excalibur Nederland beschikt over een beperkte supportorganisatie, zodat veel problemen telefonisch of via e-mail moeten worden opgelost.
Haven Rotterdam
Het Gemeentelijk Havenbedrijf Rotterdam (GHR) werkt sinds 1994 met Search’97 van Verity. Het op basis van dit product ontwikkelde informatiesysteem Port Information Net (Point) wordt ingezet als invulling van kennismanagement en ‘business intelligence’. Alle denkbare informatiebronnen van beleidsnota’s tot online nieuws en van CD’s tot Internet worden ontsloten. Er werden resultaten geboekt bij het snel beschikbaar hebben van informatie, de snelle reactie op informatieverzoeken vanuit het management en de kwaliteit van de rapportage, door de mogelijkheid tot combinatie van informatiebronnen en de hoge actualiteitswaarde. De ervaring leerde dat resultaten niet direct zichtbaar waren. Informatiewerkers hebben blijkbaar tijd nodig om de mogelijkheden ten volle te leren benutten. Maar als de ontwikkeling eenmaal in gang gezet is, dan is de groei niet meer te stuiten.
Het Havenbedrijf koos voor Verity op basis van de bewezen kwaliteit van het product, de ondersteuning door de leverancier en haar partnerorganisaties op de Nederlandse markt, en de compleetheid van de productenrange. GHR werkt met professionele informatiespecialisten. De mogelijkheid om op basis van interesseprofielen een informatie-‘push’-functie te kunnen realiseren was ook van doorslaggevend belang. Het Havenbedrijf gebruikt deze profielen ook om informatietoeleveranciers, zoals de Staatsuitgeverij en Infolook, relevante informatie te laten aanleveren.
VNU Business Publications
VNU Business Publications is de grootste Britse uitgever van IT- en business magazines. Het bereikt een doelgroep van 700.000 lezers via verschillende titels. Bewust van de nieuwe mogelijkheden van Internet begon men met een onderzoek naar de marketingmogelijkheden van hun bladen via Internet. De uitgever heeft hiervoor een aparte divisie opgezet: VNU New Media.
De website van de Britse uitgeverij biedt de mogelijkheid om de interesse kenbaar te maken. Op basis van het gedefinieerde interesseprofiel wordt een zoekopdracht uitgevoerd in de databases, en de resultaten verschijnen op het scherm. Aldus ontstaat een persoonlijk magazine. De website telt 4,2 miljoen hits per maand.
VNU Business Publications heeft gekozen voor Oracle, omdat deze leverancier een sterke marktpartij is op het gebied van ‘information management’ en een goede staat van dienst heeft op het gebied van web-gerelateerde oplossingen. Bovendien kon Oracle een robuuste totaaloplossing aanbieden. De information retrieval-functionaliteit, de Con Text Option, werd geïntegreerd in de Oracle Universal Server.