Ongestructureerde informatie van onschatbare waarde

De efficiënte verwerking van ongestructureerde informatie is een steeds belangrijkere schakel in iedere bedrijfsvoering. We verspreiden informatie via uiteenlopende informatiedragers, zoals e-mail, webpagina’s, beeld- en geluidmateriaal of tekstdocumenten. Volgens de laatste cijfers is meer dan tachtig procent van alle informatie binnen een organisatie ongestructureerd en in veel gevallen opgeslagen in een grote verscheidenheid aan content repositories, zoals file-systemen, content management-toepassingen en andere applicaties. Analisten beweren dat de hoeveelheid ongestructureerde informatie binnen organisaties zich iedere zes tot twaalf maanden verdubbelt. Omdat de efficiëntie waarmee dergelijke informatie wordt beheerd direct verband houdt met de resultaten van een onderneming, staan veel organisaties voor een relevant vraagstuk: hoe brengen we structuur aan in de enorme hoeveelheid ongestructureerde content?

Steeds vaker lossen medewerkers hun vraag naar informatie individueel op, door bijvoorbeeld zoeksoftware op de eigen pc te installeren. Bedrijfskritische informatie komt op deze manier onnodig terecht op lokale pc’s en laptops. Bovendien kan bij het overzetten van informatie van netwerk naar pc’s gevoelige informatie uitlekken. Bedrijven zouden daarom moeten zoeken naar een bedrijfsbrede oplossing die dit probleem ondervangt; een veilige methode die een positieve uitwerking heeft op de productiviteit en omzet van de gehele organisatie. Verschillende leveranciers bieden een geavanceerde geautomatiseerde methode om informatie binnen de organisatie efficiënt terug te vinden en uitwisselbaar te maken. De grote vraag: op basis van welke motieven wordt de juiste keuze gebaseerd?

Bij deze keuze zijn er twee belangrijke beperkingen waar rekening mee gehouden moet worden. Ten eerste zijn de meeste oplossingen gebaseerd op onderliggende algoritmen die niet toepasbaar zijn op bedrijfskritische content. Daarnaast zijn de functionaliteiten van de oplossingen vaak beperkt. Neem bijvoorbeeld Keyword Search (zoeken op basis van een zoekterm). Bij Keyword Search wordt de relevantie van een document alleen bepaald aan de hand van hoe vaak en waarin het document het trefwoord voorkomt. Deze methodiek zegt niets over concepten en de context van documenten en kan helaas geen relaties leggen tussen content, en al zeker niet tussen verschillende vormen van digitale data. Veel leveranciers leveren oplossingen op basis van Keyword Search, maar er is ook een meer conceptuele manier van retrieval onder de noemer Meaning Based Computing. Deze methode herkent wel de concepten en de context van ongestructureerde data en kan daardoor de relevante waarde van de informatie wel bepalen, ongeacht de vorm. Hierdoor kunnen organisaties ongestructureerde informatie niet alleen efficiënt verwerken, maar tevens de waarde van die informatie optimaal benutten en zelfs verrijken. Zoek dus naar een technologie die de onschatbare waarde van informatie onderkent.

Victor Cohen
General Manager, Autonomy Benelux & Scandinavië