AMSTERDAM – Op initiatief van het Centrum voor Wiskunde en Informatica (CWI) start een aantal Europese onderzoeksinstituten en bedrijven een onderzoek naar ‘datamining’. De Europese Commissie stelt hiervoor subsidie beschikbaar.
Het onderzoeksproject Keso (Knowledge Extraction for the Statistical Offices) gaat drie jaar duren en moet een aantal nieuwe datamining-produkten opleveren. De produkten worden op de markt gebracht door Data Distilleries, een spin-off van het CWI.
Naast het CWI participeren de Duitse zusterorganisatie GMD en de Universiteit van Helsinki in het project. Het CBS, Tilastokeskus (het Finse CBS), het Duitse bedrijf Infratest Burke en het Griekse statistiekbureau gaan de toepasbaarheid van de produkten in de praktijk testen.
Inductieve querytaal
Volgens projectleider dr Arno Siebes, werkzaam op het CWI, is het de bedoeling een "inductieve querytaal voor datamining bovenop SQL en ODBC" te ontwikkelen. Daarbij wordt voortgebouwd op de resultaten van een eerder onderzoek dat heeft geleid tot de datamining-tool Datasurveyor, waarvan de eerste versie binnenkort door Data Distilleries wordt uitgebracht.
"Conventionele hulpmiddelen, zoals statistische pakketten en standaard querytalen, zijn vanwege de onderliggende technologie niet geschikt om grote hoeveelheden complexe data te analyseren op verborgen patronen en relaties. Ik wil niet zeggen dat elke vraag die men wil stellen, kan worden uitgedrukt in de querytaal die wij nu ontwikkelen. De claim ‘universeel’ gaat me daarom wat te ver. Maar het is wel zo dat er voldoende algoritmes inzitten om het zoeken naar antwoorden op complexe vragen een stuk sneller en gemakkelijker te maken", aldus Siebes. Begin volgend jaar zal een nieuwe versie van Datasurveyor klaar zijn, zodat de verschillende statistiekbureaus met de praktijktesten kunnen beginnen. CZ