Nederlandse starters op het grensvlak van taalkunde en kunstmatige intelligentie (artificial intelligence, ai) spelen zich in de kijker. Dit bleek onlangs tijdens de AI Expo 2018 in Amsterdam. Veel aandacht trekt natural language processing (NLP), een vorm van machine learning waarbij computers leren om teksten te begrijpen. Het aantal nuttige toepassingen van computerlinguïstiek groeit geleidelijk zoals het automatisch samenvatten van teksten, het halen van onderwerpen uit een tekst, sentiment-analyse alsmede chatbots.
Er kan echter nog veel worden verbeterd, zo werd duidelijk tijdens diverse fora op de AI Expo. Taal is niet heel precies en niet gestructureerd. Dialecten maken het nog moeilijker. Woorden worden heel verschillend uitgesproken. Ook bedoelt niet iedereen altijd hetzelfde. Het is voor een computer niet voldoende om de woorden goed te begrijpen. Woorden krijgen pas betekenis als ze met elkaar worden verbonden.
Volgens Pierluigi Casale, group data scientist bij TomTom, moeten ondernemingen die NLP toepassen daarom hun eigen vocabulaire maken. Neem bijvoorbeeld het veelgebruikte woord ‘cool’. Dat kan door een computer snel verkeerd worden begrepen. Meestal betekent dit gaaf of tof. ‘Maar tijdens een conversatie over licht zegt het iets over de kleurtemperatuur’, aldus Casale die eerder bij Philips Lighting werkte. Ook moet rekening worden gehouden met verschillen in sentimenten. In de zin ‘Ik haat racisme’ heeft het woord ‘haat’ een andere gevoelswaarde dan in de zin ‘Ik haat maandagen’. Per domein kunnen woorden een verschillende betekenis hebben. Een probleem is dat woorden dubbelzinnig kunnen worden bedoeld.
Grote concerns gebruiken NLP voor het analyseren van teksten om daar waardevolle informatie over bijvoorbeeld consumentengedrag uit te halen. Volgens Alejandra Leon, global segment architect bij Shell, is bij NLP-projecten de kwaliteit van de data cruciaal. Dit wordt nog wel eens onderschat. ‘U kunt de beste data scientists in huis halen. Maar als de data niet schoon zijn, begint u weinig.’
Ondanks deze struikelblokken komen vooral in Amsterdam start-ups op met veelbelovende toepassingen van NLP.
Zazu

Zazu, voortgekomen uit de Universiteit van Amsterdam, wil met NLP het plannen van vergaderingen vergemakkelijken. De persoonlijke assistent (m/v) van Zazu kan dankzij ai-technologie deze vaak lastige secretariële taak overnemen. Deelnemers aan een overleg hoeven alleen maar een email-adres (emma@zazu.ai) in het cc veld toe te voegen. Vervolgens bepaalt de virtuele assistent Emma datum, tijd en locatie. Zazu werkt zonder dat een applicatie of plug-in nodig is.
De applicatie leest de inhoud van de mails die deelnemers aan een vergadering met elkaar uitwisselen. Mede-oprichter Jesse Grift: ‘Momenteel heeft Zazu toegang tot Google Calendar. Later komt daar Office 365 bij.’ Hoe meer Zazu wordt gebruikt des te beter de software zich aanpast aan iemands persoonlijke voorkeuren en meetings kan plannen. Gewerkt wordt aan extra functies die het aantal emails voorafgaande aan een vergadering verder doen verminderen.
De dienst komt binnenkort beschikbaar. Tot de grootste concurrenten behoort Doodle. Bij deze dienst stellen de deelnemers opties voor een datum en locatie voor, waarna de deelnemers worden uitgenodigd om te stemmen. Zazu is volgens Grift veel sterker geautomatiseerd.
Amberscript
Het Amsterdamse Amberscript heeft Saas-software ontwikkeld die audio automatisch omzet in tekst. Door op een woord te clicken kan je gemakkelijk teruggaan naar het oorspronkelijke geluidsfragment. Zo is het ook mogelijk om snel iets te corrigeren, bijvoorbeeld bij het uitwerken van interviews. Het bedrijf claimt een nauwkeurigheid van 95 procent, waar concurrenten vaak niet verder dan 80 procent komen. Amberscript gebruikt de Google-engine. De kwaliteit gaat omhoog naarmate de engine wordt gevoed met meer geluidsfragmenten. Ook helpt het om audio van sprekers met verschillende accenten in te voeren.
Braincreators
Een andere deelnemer aan de AI Expo was Braincreators. Dit Amsterdamse bedrijf maakt voor BNR Nieuwsradio software die uit radioprogramma’s de onderwerpen haalt. Luisteraars kunnen na de uitzending precies de radiofragmenten over de onderwerpen terugzoeken waarvoor ze interesse hebben. BNR krijgt hiervoor subsidie van Google. Het project moet eind augustus live gaan.
Botsquad
Botsquad past computerlinguïstiek toe bij chatbots. Deze hoofdstedelijke startup richt zich op de ontwikkeling van een platform voor ‘conversational apps’. Deze apps bieden elke individuele klant van een bedrijf een persoonlijke ervaring, zonder dat downloads, ruimtebeslag op het apparaat of wachtwoorden nodig zijn. Botsquad begon zijn bestaan door chatsbots te ontwikkelen op basis van een van de vele platforms die eenvoud in combinatie met oneindig veel mogelijkheden claimen. Het blijkt inderdaad mogelijk heel gemakkelijk een prototype van een simpele chatbot te maken die basisdialogen aankan. Maar naarmate hogere eisen worden gesteld aan de complexiteit van de conversatie toenam, gaat de ontwikkeling van de chatbot stroever. De behoefte aan een echte programmeertaal doet zich dan toch voelen. Nadeel daarvan is dat klanten zonder programmeurs dan niet meer zelf kunnen ontwikkelen.
Botsquad kwam daarom op het idee om een one-stop platform te lanceren waarmee niet-programmeurs toch een eind kunnen komen. Ontwikkeld werd een makkelijk te begrijpen programmeertaal voor conversational apps. Bubblescript is speciaal bedoeld om conversaties te modelleren en geautomatiseerde taken uit te voeren. Machine learning wordt toegepast om computers te leren omgaan met slordig taalgebruik. De kunst is er achter te komen wat de gebruiker werkelijk bedoelt. Botsquad heeft verschillende open source NLP-toolkits in Bubblescript gestopt. Het Botsquad-platform staat open voor integratie met ‘hosted NLP platforms’. De klant kan dus zelf een NLP-platform kiezen en dit toevoegen aan Botsquad.