Taalwetenschapper Piek Vossen, verbonden aan de VU, ontvangt een NWO-Spinozapremie 2013, de hoogste wetenschappelijke onderscheiding in Nederland. Dat maakte de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) bekend. Naast Vossen krijgen ook de natuurkundige Michail Katsnelson en de chemicus Bert Weckhuysen zo'n premie. De laureaten ontvangen dit najaar elk 2,5 miljoen euro, te besteden aan wetenschappelijk onderzoek.
NWO kent de NWO-Spinozapremies jaarlijks toe aan in Nederland werkzame onderzoekers die naar internationale maatstaven tot de absolute top van de wetenschap behoren.
Professor Piek Vossen (1960) is hoogleraar Computationele Lexicologie aan de Vrije Universiteit Amsterdam. Hij combineert taalwetenschap en informatica om taalkundige verschijnselen te analyseren met computermodellen. Hij maakte voor de Europese Unie ‘wordnets’ in acht talen. Wordnets zijn spinnenwebben van alle woorden van een taal, met elkaar verbonden op basis van betekenis. Door de wordnets onderling te koppelen legde Vossen de basis voor systematisch onderzoek naar de verschillen en overeenkomsten en naar betekenis en cultuur in talen. Wordnets maken het bovendien mogelijk dat taal beter begrepen wordt door machines.
Wordnets
Vossen breidde het project vervolgens uit en richtte samen met andere wetenschappers in 2000 de Global WordNet Association op, waarvan hij nu voorzitter is. Inmiddels zijn er van ruim honderd talen wordnets die onderling verbonden zijn. Vossen voegde een fundamenteel element toe aan de wordnets door ze te koppelen aan ontologiën: logische definities van concepten die computers in staat stellen te redeneren.
Het onderzoek van Piek Vossen legt de basis voor veel grote en kleine onderzoeksprojecten waarbij taal en techniek worden gecombineerd. Het onderzoek brengt vragen naar taal als : ‘Wat is een woord en wat is een concept? Zijn alle denkbare samenstellingen woorden en concepten?’ samen met de technische verwerking van dit soort vragen. Zijn team bouwde bijvoorbeeld een gesproken gesprekssysteem voor gemeenten om telefonische vragen af te handelen.
Zijn meest recente project is de Geschiedenisrecorder. Het is een computersysteem dat nieuwsberichten verzamelt en die van vandaag aan die van gisteren koppelt, en verder terug in de tijd. Zo legt het systeem de geschiedenis vast.
Keyword retrieval
Vossen is sinds 2006 hoogleraar aan de Vrije Universiteit Amsterdam. Hij is hoofd van het Computational Lexicology & Terminology Lab. In De Volkskrant stelt hij in een interview dat het doel van de computerlinguïstiek is om software te ontwikkelen die een computer de taalvaardigheid van een mens geeft. ‘Een van de grootste uitdagingen is omgaan met de ambiguïteit en de onzekerheden in de natuurlijke taal. Computers kunnen goed met exacte gegevens omgaan. Echte taal zit vol fouten en ruis. Hoe kun je een machine daarmee leren omgaan, dat is de vraag.’
Ook merkt hij dat taaltechnologie meestal wordt geassocieerd met spraakherkenning. In zijn ogen is ‘keyword retrieval’ veel spannender: het opdiepen van de essentie in een geschreven tekst. ‘Voor automatische tekstanalyses, samenvattingen, het doorzoeken van grote bestanden vakliteratuur. En het leggen van verbanden.’ Voor zijn onderzoeksgroep is de Watson-computer van IBM een ijkpunt. Die versloeg eerder andere kandidaten bij de Amerikaanse tv-kennisquiz Jeopardy!; IBM wil Watson nu inzetten in de zorg, om bijvoorbeeld voor medici, die daar amper tijd voor hebben, de literatuur bij te houden en indirecte verbanden te leggen.
Het internet noemt hij in De Volkskrant een goudmijn voor taallinguïsten: ‘Dat is talige informatie, maar in een geautomatiseerde omgeving. Daar kun je mee spelen, dingen opsporen, theorie toetsen. Geweldig.’