Hoe leer je een computer om de inhoud van plaatjes te herkennen? Ofwel door computers slimmer te maken, ofwel door de internetgemeenschap te verleiden tot het classificeren van afbeeldingen.
Het herkennen van een appel lijkt simpel, maar een computer vindt dat erg moeilijk. Zo moeilijk, dat de Indiase informatieonderzoeker Anarta Ghosh aan de Rijksuniversiteit van Groningen is gepromoveerd op dit onderwerp. Ghosh: "Alle appels zijn net een beetje anders. Ze zijn rood of groen, klein of groot, maar toch herkent een mens ze allemaal moeiteloos als appels. Dat komt omdat al die appels iets gemeen hebben. De informatie daarover is opgeslagen in ons brein en noemen we het prototype van een appel." Computerwetenschappers bedenken algoritmes waarmee een computer kan berekenen of een bepaald voorwerp een appel is of niet. Ghosh: "De prestaties van die algoritmen worden echter nauwelijks systematisch gecontroleerd." Ghosh bracht daarin verandering. Hij mat de prestaties van algoritmen voor het herkennen van objecten op basis van incomplete contouren. Dat laatste is belangrijk, omdat objecten in de werkelijkheid vaak maar gedeeltelijk zichtbaar zijn, vanwege bijvoorbeeld de lichtval of doordat er een ander object in de zichtlijn staat.
Ghosh kon vervolgens voorstellen doen om een aantal algoritmes wiskundig te verbeteren. Daarnaast ontdekte hij dat computers iets gemeen hebben met mensen: ze herkennen objecten beter als de meest bochtige gedeelten van hun omtrekken goed zichtbaar zijn. Om bijvoorbeeld een dier te classificeren als een hond, kun je beter de kromming van zijn neus zien, dan de contouren van zijn (vlakke) rug.
Tot slot onderzocht Ghosh een bepaald type algoritme waarmee je prototypes kunt uitrekenen. Met deze ‘Learning Vector Quantizations' (LVC) kun je niet alleen objecten classificeren, maar ook bijvoorbeeld stemmen herkennen of beschrijven hoe genen tot uiting komen. De onderzoeker gebruikte methoden uit de statistische natuurkunde om de prestaties van deze algoritmen systematisch te meten en op die manier te verbeteren.
Zoekmachine voor plaatjes
Een geheel andere benadering volgt Luis von Ahn (www.cs.cmu.edu/~biglou). Deze 28-jarige hoogleraar computerwetenschappen, zelf een fervente gamer, ontwikkelt online spellen waarmee internetgebruikers spelenderwijs illustraties benoemen. Google begreep dat dit het uitgangspunt is voor een superbe zoekmachine voor plaatjes en nam een licentie op de software: images.google.com/imagelabeler.