Mike Lynch, oprichter en ceo van Autonomy, kondigt de komst aan van een nieuw tijdperk van enterprise search: “Voor het eerst past de computer zich aan de behoeften van de gebruiker aan.”
Lynch begon in 1990 met Neurodynamics, een bedrijf dat zich vooral met theoretische vraagstukken bezighield, maar behalve dat toch ook met enige praktisch onderzoek op het gebied van de identificatie van vingerafdrukken op de proppen kwam. Gaandeweg werd Lynch duidelijk dat de resultaten van dit onderzoek ook van toepassing waren op het zoeken naar verbanden in informatie. Sleutelwoord: patroonherkenning. Zo ontstond Autonomy in 1996 als een spin-off van Neurodynamics.
De eerste klanten waren regeringen en veiligheidsdiensten. “Zij vonden onze ideeën interessant en boden ons de kans om vandaag aan de slag te gaan met de problemen van morgen. We bouwden applicaties voor ze, waarmee ze zinvolle informatie konden ontsluiten uit ongestructureerde informatie. Destijds betrof dat in het algemeen nog maar een klein deel van de informatie. Het meeste lag vast in gestructureerde databases. Nu is dat wel anders. In tien jaar tijd is de hoeveelheid ongestructureerde informatie in bedrijven vier keer groter geworden dan de hoeveelheid gestructureerde data.”
Inmiddels maken de ‘intelligence’- en overheidsklanten nog maar 20% uit van het klantenbestand van Autonomy, vertelt Lynch. “Het leeuwendeel bestaat nu uit grote, internationaal opererende bedrijven.”
Ruim een jaar geleden heeft u uw concurrent Verity overgenomen. Is de K2-productlijn van Vertity voortgezet of samengevoegd met uw eigen IDOL-platform?
“Het laatste. De nieuwe release 7 van K2 is al volledig gebaseerd op ons IDOL-platform. Dat was ook niet zo moeilijk te realiseren. Toen wij begonnen was Verity de grootste in de markt. Om die reden hebben we er altijd voor gezorgd dat onze software er goed op aansloot. K2 heeft nu de IDOL-engine als basis. Dat biedt meer mogelijkheden. Zo zijn er met K2 nu ook queries in audio- en videobestanden en clustering van zoekresultaten mogelijk.”
Kunt u in het kort omschrijven hoe uw software werkt?
“Onze software kan de betekenis van informatie herkennen, ongeacht de woorden, waarvan gebruik gemaakt wordt. Wij noemen dat ‘meaning based computing’. Neem het woord ‘hond’. De computer begrijpt niks van wat een hond is of wat dat dier doet. Door de context erbij te betrekken kun je patronen herkennen. Bijvoorbeeld: een hond moet je uitlaten, dus ermee lopen, wandelen, enzovoort. Door zulke relaties te leggen krijg je niet alleen treffers op het woord ‘hond’, maar misschien ook op golden retriever, puppy, jachthond, tekkel, enzovoort. Ook dialecten zijn zo geen probleem. Bij zoekmachines die met trefwoorden werken, krijg je een lijst van alle documenten waarin letterlijk het woord ‘hond’ voorkomt. Ongeacht de context dus. Daardoor mis je een heleboel relevante informatie. Dit is de kern.
Daarnaast bevat onze software ook andere slimme technieken, zoals de mogelijkheid van clustering van zoekresultaten. Door die clusters op verschillende tijdstippen met elkaar te vergelijken krijg je onverwachte uitkomsten. Bijvoorbeeld nieuwe vragen die bij een call center binnenkomen of een nieuw soort klachten over een bepaald product. Zonder die vergelijking zouden deze signalen ondergaan in de massa en niet tijdig worden opgemerkt door kwaliteitsmanagers en marketeers.”
Google, maar ook Microsoft, Oracle, IBM en SAP geven hun enterprise zoeksoftware bijna voor niks weg. Is dat niet heel lastig voor u?
“Nee, helemaal niet, want dat is allemaal zoekfunctionaliteit gebaseerd op trefwoorden. Prima, maar beperkt. Onze klanten begrijpen heel goed dat er meer nodig is en ze zijn bereid daar voor te betalen. We ervaren dan ook hoegenaamd geen prijsdruk. Vergeet niet dat grote klanten soms wel driehonderd verschillende systemen operationeel hebben. Ze hebben behoefte aan software die informatie over al die systemen heen op een slimme manier kan ontsluiten.”
Is meaning based computing niet het zoveelste obligate buzzword?
“Nee, dit is een erg belangrijke trend. We zijn getuige van de grootste verandering binnen de it sinds het begin van de automatisering. Vroeger pasten wij ons aan de computer aan. Kijk maar naar relationele databases. Je moest alle informatie precies structureren en op maat maken naar de eisen van zo’n database. Nu wordt het andersom. De computer gaat meedenken. Hij past zich voor het eerst aan onze behoeften aan. Je zal in de nabije toekomst opzienbarende vragen krijgen vanuit je eigen software. Zoals: ‘Is het je opgevallen dat hier iets nieuws gebeurt?’ ‘Zou je hier misschien ook eens naar willen kijken?’ Wij noemen dat ‘implicit queries’. Zo krijg je automatisch antwoord op vragen waarvan je niet eens wist dat je ze kon stellen.”