Na het eclatante succes van de supercomputer Watson bij de beroemde Amerikaanse quiz Jeopardy! ligt voor IBM de weg vrij om de analytische technologie achter het systeem in te zetten bij de overheid en het bedrijfsleven. De Nederlander Marc Teerlink, global strategist IBM Center of Competence, was in de Verenigde Staten betrokken bij de ontwikkeling van Watson. Hij buigt zich nu over de commerciële toepasbaarheid van Watson.
Om het geheugen op te frissen: de Amerikaanse quiz Jeopardy! is een pittige kennisquiz waarbij met geld strategisch op antwoorden kan worden geboden. Een kruising tussen Triviant en Met het mes op tafel, maar dan stukken moeilijker. IBM heeft de afgelopen vier jaar gewerkt aan de bouw van Watson, vernoemd naar oprichter Thomas J. Watson, om mee te kunnen doen aan Jeopardy!. Afgelopen februari won Watson de quiz glansrijk van de twee beste kandidaten die in het verleden meermalen hadden gewonnen.
Playstation 2880
Watson heeft 2880 processorkernen en vijftien terabyte aan geheugen, draaiend op het IBM Power 750-serversysteem. De supercomputer was voor de quiz volgestopt met een corpus aan documenten, variërend van boeken en artikelen tot aan weblogs, en bij elkaar opgeteld goed voor zo'n tweehonderdmiljoen pagina's aan content, ongestructureerd en gestructureerd. 'Ik noem Watson wel eens grappend een Playstation 2880', zegt Marc Teerlink, global strategist IBM Center of Competence. Hij behoorde tot een van de vijfentwintig onderzoekers van IBM die in de Verenigde Staten betrokken waren bij de bouw van Watson.
Watson gebruikt voor het razendsnel beantwoorden van de quizvragen een mix van natuurlijke taalverwerking, semantische analyse, informatieherkenning, 'automated reasoning' en machine learning. Het team bouwde voort op de zoek- en taaltechnologie die bij IBM al voorhanden was. De meeste zoekmachines zijn indexgedreven en gebaseerd op een vraag/antwoord-structuur. Watson maakt gebruik van tal van modellen, waaronder statistische modellen en regelmodellen, verifieert patronen, werkt associatief en verwerkt kuddes hypotheses. Er zijn drieduizend bladzijden aan mathematische regels in het systeem verwerkt, vertelt Teerlink.
Routeplanner
Watson werkt associatief en geeft het antwoord waarin die het meeste vertrouwen heeft. Een voorbeeld: bij een vraag uit Jeopardy! over het Turkse aspect van de culturele hoofdstad van Europa in 2010, heeft hij het volste vertouwen in Istanboel als antwoord. Als tweede optie, met een veel lager betrouwbaarheidspercentage, geeft hij Essen: die Duitse stad was in 2010 eveneens culturele hoofdstad en als zodanig genoemd in tal van documenten over dit onderwerp.
Hij wijst er op dat het onderzoeksteam resultaten uit het schaakproject met schaakcomputer Deep Blue van jaren geleden heeft meegenomen bij de ontwikkeling van Watson. 'Wat haast vergeten is, is dat in Deep Blue routeplanningsalgoritmen zaten die de basis zijn geweest voor de doorbraak van de navigatiesoftware naderhand. Die functionaliteit hebben we in Watson meegenomen. Dat geldt ook voor de softwaretools die IBM voor het tennistoernooi van Wimbledon heeft ontwikkeld.' Ook van overnames zoals SPSS (leverancier van software voor voorspellende analyses) en Coremetrics (webanalyse-software) in 2010 heeft het Watson-team kunnen profiteren.
Betere data
Het doel van Watson was echter niet het bouwen van een 'hyperintelligente' spelletjescomputer, benadrukt hij. Het meedoen aan Jeopardy! was een test, net als het opzetten van de schaakmatch met Deep Blue. Uiteindelijk is het doel om klanten verder te kunnen helpen door een manier te vinden om taalbegrippen en informatiebegrippen aan elkaar te koppelen, stelt Teerlink.
Hij is de komende twee jaar in Nederland gestationeerd en zal met innovatief ingestelde klanten brainstormen over de toepasbaarheid van Watson voor het verbeteren van service- en verkoopprocessen. 'Ik denk dan aan selfservicediensten bij bedrijven of instanties. Die zijn nu beperkt vraag/antwoord-gericht, of je moet een Q/A-document van 46 pagina's doorploegen als je 's avonds bijvoorbeeld een printerprobleem hebt en de helpdesk is dicht. Met slimmere, analytische zoektechnologie kun je gerichter zoeken uit veel meer bronnen en krijg je kwalitatief betere antwoorden.' Eigenlijk draait het om het verkrijgen van kwalitatief betere data en het op een andere manier analyseren van data. Dan ook kun je pas het gedrag van klanten goed meten, vindt hij. 'Turning data into dollars' was een vergelijkbaar programma van IBM in de VS waarbij ik betrokken was.'
Lcars of HAL
Teerlink ziet bijvoorbeeld kansen liggen bij de medische sector. Artsen kunnen Watson inzetten bij het stellen van een diagnose; de machine zoekt dan razendsnel in een grote hoeveelheid vakliteratuur en referentiemateriaal en kadert . 'Maar', benadrukt de IBM-onderzoeker, 'Watson blijft een hulpmiddel. De machine geeft niet hét antwoord, maar helpt op een hele snelle en vertrouwde manier een antwoord te vinden. Het is nog steeds geen artificiële intelligentie.' Watson beredeneert niet zelfstandig. Het systeem vergelijkt de vraag met potentiële antwoorden. Het begrijpt de vraag niet. Hij lijkt meer op de computer Lcars uit Star Trek dan HAL uit Space Odyssey!'
De Nederlandse IBM-strateeg heeft een opleiding als consumentenpsycholoog en bedrijfskunde achter de rug, heeft in negen landen gewoond en beheerst acht talen. Het Watson-project was hem dan ook op het lijf geschreven. Hij kijkt er met veel plezier op terug. 'Bijzonder leuk was het bedenken van taalconstructies of vragen die voor meerderlei uitleg vatbaar zijn. Bijvoorbeeld: 'I was dreaming I shot an elephant in my pyjamas.' Of wanneer Watson een vraag zou krijgen over Paris en Hilton. Hoe betrouwbaar zou zijn antwoord dan zijn?' Ook schiet hem het vreemde gokgedrag van de supercomputer te binnen: Watson koos als inleg geen afgeronde getallen zoals menselijke spelers gewend zijn, maar 937 dollar of 2781 dollar. 'Strategisch waarschijnlijk slimmer, maar we hebben toch maar precisie ingebouwd.'
Taaltechnologie
De ontwikkelingen op het vlak van taaltechnologie verlopen snel, merkt hij. Onderzoek is nu vooral gericht op foto en video. Het gesproken woord herkennen is iets wat IBM al met een aantal verzekeringsbedrijven doet en nu ook in de medische wetenschap aan het toepassen is. Teerlink verwacht dat er veel vooruitgang wordt geboekt in het herkennen van stress, emoties en beweging (lichaamstaal, groepsgedrag) in beeld en geluid. 'Over vier tot zes jaar komt hiervoor op de markt software beschikbaar waar wij als consumenten de voordelen van zullen plukken. Dit past ook in IBM's lange termijnstrategie van 'smarter analytics', aldus Teerlink.
Zeer interessant en to the point voor veel bedrijven vooral rondom smart scheduling, social media, customer focus, resource (any!) allocation en bv predictive maintenance. “Watson” heeft de potentie vele business modellen te beïnvloeden / veranderen en tot meer efficiente en flexibele bedrijfsvoering te komen.
Helder artikel, duidelijk wordt dat er eigenlijk sinds Deep Blue niet zoveel meer is veranderd dan de schaalgrootte aan data en aan analytics. Het spel is nog steeds verbeterde informatie voorziening voor bedrijven en overheden met hopelijk wat (IBM-supported?) open-source toegang voor consumenten waarvan er toch steeds meer behoeften hebben aan “consulytics” om er nog maar eens een term tegenaan te gooien.