Een team van wetenschappers van het VUB (Vrije Universiteit Brussel) AI Experience Center heeft een nieuw algoritme uitgewerkt voor een zelfrijdende rolstoel. Het algoritme leert volledig zelfstandig en sneller dan bestaande versies en dit op basis van trail-and-error.
Het algoritme dat de rolstoel aanstuurt, werkt volgens het principe van ‘reinforcement learning’, een vorm van machine learning waarbij de computer leert door te experimenteren in de omgeving waarbinnen die actief moet zijn. Klassieke reinforcement learning vereist echter veel interacties, waardoor het leerproces vaak van lange duur is. Het nieuwe algoritme maakt daar komaf mee en dringt de leertijd terug tot ongeveer een tot twee uur.
‘Reinforcement learning is een systeem gebaseerd op trial-and-error: de rolstoel wordt beloond als die iets goed doet, bijvoorbeeld een obstakel vermijden’, zegt hoofdonderzoeker Denis Steckelmacher. ‘Wanneer de rolstoel een ongewenste actie doet, wordt die ‘gestraft’. Om het leerproces te versnellen, combineert ons algoritme op een slimme manier verschillende types van reinforcement learning. Zo compenseert de ene de zwaktes van de andere. Dit resulteert in een leerproces dat snel gaat als we voldoende zeker zijn en voorzichtig bijstuurt bij onzekerheid.’
Dagelijkse leven
Deze innovatie is meer dan wetenschappelijk onderzoek alleen. De rolstoel is namelijk in te zetten in het dagelijkse leven en maakt zelfrijdende rolstoelen comfortabeler en veiliger. ‘Binnen het VUB AI Experience Center doen we onderzoek naar kunstmatige intelligentie in alle mogelijke toepassingen’, zegt prof. Dr. Ann Nowé. ‘Een van de streefdoelen is die knappe technologie te gebruiken ten voordele van de mens, als hulpmiddel dat het ons leven makkelijker of beter maakt. Deze rolstoel is daar een sterk voorbeeld van. Dat is ook de filosofie achter de intentie van de VUB en ULB om een ‘ai-initiatief voor het algemeen belang’ uit de grond te stampen.’