Het was slechts een kwestie van tijd voordat kunstmatige intelligentie samen met machine learning ons in staat zou stellen om ook herkenbare gezichten bij nacht en ontij te produceren uit beelden van warmtecamera's. Dat is het U.S. Army Research Laboratory inmiddels gelukt.
‘Het doel van de technologie is om warmtebeelden van gezichten te kunnen combineren met bestaande data uit biometrische gezichtsdatabases’, zegt onderzoeker Benjamin Riggan op de site van het onderzoekslab. De ontwikkeling kan leiden tot verbeterde real time biometrische herkenning van personen die militairen tegenkomen en tegelijkertijd met infrarood bodycams opnemen of forensische analyses achteraf van geheime operaties.
Een belangrijke reden voor het verzamelen van beeldmateriaal met infraroodcamera’s is dat het bij een militaire operatie niet altijd handig is om een zaklamp op iemands gezicht te schijnen.
Openbare gezichtsdatabases
Om het doel te bereiken, namelijk het verwerken van warmtecamerabeelden tot voor de mens herkenbare foto’s, trainde de onderzoeksgroep bestaande gezichtsherkenningssoftware samen met menselijke analyse van de uitkomsten en openbare gezichtsdatabases. Daaruit ontwikkelden ze een systeem waarbij zowel het totale gezicht als lokale onderdelen, zoals neus of mond, voor herkenning worden gebruikt. De combinatie van de verschillende onderdelen zorgt voor betere herkenning.
Hiervoor gebruikten de onderzoekers een conventioneel neuraal netwerk waarbij het hele gezicht en de lokale delen van het gezicht werden vergeleken en zo stapsgewijs werden verbeterd tot een herkenbaar beeld. Om een ‘normaal’ herkenbaar beeld samen te stellen, moest de software de stappen verschillende keren doorlopen.
Thermische camera
Om het onderzoek uit te voeren, gebruikten de onderzoekers open source software van DLIB en het open source vgg-face-model.
Als proof-of-concept-demonstratiemodel gebruiken de onderzoekers een FLIR Boson 320 thermische camera en een laptop waarop het algoritme in bijna real time draait. De demonstratie werd onlangs getoond op de IEEE Winter Conference of Applications of Computer Vision in Nevada. De paper is te vinden op de servers van Arxiv.