Over het nut van ai is Jed Dougherty, vicepresident van Platform Strategy bij Dataiku, snel uitgepraat. Luister volgens hem maar naar wat klanten vertellen vandaag; ze willen strategische bedrijfsbeslissingen nemen op grond van beschikbare gegevens, zij willen trends kunnen vaststellen. ‘Niet overvallen worden door iets, maar het roer in handen hebben’. Een gesprek.
In de rol van zijn functie treedt Dougherty op als strategisch-technisch adviseur voor klanten en prospects. Hij werkt ook nauw samen met engineering en product-stakeholders. Computable spreekt hem tijdens de Dataiku-conferentie in London over het nut en de valkuilen van kunstmatige intelligentie (ai).
Zwarte doos
In de eerste klas van de HTS Weg- en Waterbouwkunde, vijftig jaar geleden, mochten we geen rekenmachines gebruiken. Alles met de rekenliniaal, want dan zie je wat de sinus, wortel, macht of wat dan ook doet met de berekening. Het docentenkorps wantrouwde de calculator, want een zwarte doos. Is er eenzelfde wantrouwen ten aanzien van ai?
Jed Dougherty, na een aanvankelijke glimlach: ‘Het doel van Dataiku is de democratisering van ai; de technologie moet bruikbaar zijn voor iedereen binnen een organisatie. Niet alleen datadeskundigen, maar vooral ook marketeers, verkopers, inkopers. Iedereen die een bepaalde rol in de bedrijfsvoering heeft, moet ermee kunnen werken. Dan moet iedereen er ook wel vertrouwen in hebben dat het goed werkt. We zien in de praktijk dat niet altijd de juiste modellen worden toegepast. Vaak omdat vooroordelen (bias) erin zijn verweven. Dat kunnen wij in onze software niet tegengaan. Wel hebben we bewakingsregels ingebouwd. Als een antwoord te mooi is om waar te zijn, dan krijg je een waarschuwing. Misschien heb je het antwoord onbewust al in het model gestopt. Je kunt overigens zelf ook zulke regels inbouwen.’
Goed gebruik van een rekenmachine, aldus de docenten destijds, betekende dat je als gebruiker over de kennis moet beschikken om zelf bij benadering te kunnen weten of een uitkomst valide is. Hoe doe je dat met ai?
‘Wij zijn van mening dat effectief werken met ai een inleidende training in statistiek en gegevensanalyse vereist. Wij bieden deze diensten zelf aan als onderdeel van het onboarding-proces. Wij verklaren de basisbeginselen van ai. In de praktijk blijkt daar ook behoefte aan te bestaan. Vrijwel elk bedrijf dat met onze oplossing aan de slag gaat, vraagt zo’n basis training aan. Het betekent ook dat wij helpen om verschillende bedrijfsonderdelen verstandig met elkaar te leren omgaan. Ze moeten elkaar leren begrijpen. Zinvol ai toepassen, komt niet vanzelf; daar moet je als bedrijf aan werken.’
Welke bedrijven lopen hierin voorop?
‘Wij hebben veel klanten in de financiële dienstverlening om bijvoorbeeld risico’s af te dekken en fraude te bestrijden. Verder de geneesmiddelenindustrie die wil weten hoe zij bepaalde testen moet uitvoeren. De maakindustrie gebruikt ai om de logistiek goed te inregelen. Verzekeringsmaatschappijen zetten de technologie in om tot een juiste premievoering te komen. Precisielandbouw kan niet onder ai. Eigenlijk heeft elke sector wel een of meerdere redenen om met kunstmatige intelligentie aan de slag te gaan.’
Wat doe je tegen bevooroordeling in modellen?
Dougherty, geboren en getogen in New York, stelt voor beantwoording eerst vast dat er ten aanzien van privacy andere regels gelden in de VS en Europa. ‘Nou ja’, zegt hij, ‘In Europa gelden regels. En die bouwen wij natuurlijk in in onze software.’
‘Toen ik als data-scientist werkte voor de gemeente New York wilden we nagaan of we kunnen voorspellen welke telefoonoproepen naar het alarmnummer 911 echt zijn en welke vals. Als je dat weet, kun je levens redden. We hebben historische data over een periode van tien jaar beoordeeld om een betrouwbaar model te kunnen bouwen. Toen ik dat visualiseerde op de plattegrond van New York zag ik dat oproepen vanuit de armere wijken in de stad veel minder werden beantwoord dan vanuit de rijkere delen. Dat was een schokkende ontdekking en betekende tegelijkertijd dat we al die data de vuilnisbak in konden gooien. Er zat te veel bias in om een goed model te kunnen bouwen. Vooroordelen voorkom je door te werken met divers samengestelde teams. Niet alleen wat betreft de functies binnen een organisatie, maar ook wat betreft culturele, religieuze afkomst en seksuele geaardheid. Binnen Dataiku zorgen wij daarvoor en bij klantprojecten hameren wij er ook op.’
Diversiteit
Jurriaan Krielaart, directeur Nederland van Dataiku, onderstreept de woorden van Dougherty: ‘Wij hebben dertig mensen op ons kantoor in Amsterdam, van wie er zeventien een andere nationaliteit hebben. Diversiteit is uitermate belangrijk.’
Bedrijven hebben moeite om de waarde van hun data in kaart te brengen. Terwijl dat toch de grondstof is van ai. Hoe pak je dat aan?
‘Als je twee teams dezelfde database laat gebruiken, komen ze met verschillende antwoorden. De waarheid bestaat niet. Daar moet je je bewust van zijn. Je moet de echtheid van data beheersen, vaststellen dat ze niet in tussentijd zijn veranderd. Wij hebben daar tools voor. Verder helpen wij met de inrichting van de infrastructuur om data op de juiste manier te gebruiken. En natuurlijk moet je toegangsregels tot data opstellen. Het is anders dan de afgelopen vijfentwintig jaar toen alles in een gestructureerde database ging. Nu heb je data overal; on-premises, in meerdere clouds, in de edge. Dat moet je allemaal goed vastleggen en reguleren. En beveiligen natuurlijk.’
In 2014/2015, toen Dataiku de markt betrad, waren jullie ‘disrupting’. Zijn er nu partijen die aan jullie stoelpoten zagen?
‘Wij zijn een gevestigde naam. Ons voordeel is dat wij alle aspecten die met ai te maken hebben, in ons platform hebben verenigd: de modellering als kern met daaromheen databases, cloud, business-intelligence, de verwerking van gegevens, het coderen, en het analyseren van de uitkomsten. Er is geen partij die het zo integraal aanpakt als wij. Maar op deelaspecten zien we partijen opkomen, bijvoorbeeld op het gebied van cloud en het ontwikkelen van ontwikkelaarstools. We moeten bij de les blijven; ons werk is nog niet gedaan.’
Strategische bedrijfsbeslissingen nemen op grond van beschikbare gegevens klinkt als een contradictio in terminis als we kijken naar het tijdsvak en de voortschrijdende ontwikkelingen. Jed klinkt niet als Henk die alsmaar wantrouwender werd aangaande de AI door zoiets als het modelleren van de angstporno voor een lockdown. En Hendrik heeft ook weinig vertrouwen in de stikstofmodellen die meer om politiek gaan dan wetenschap waardoor half Nederland bang is voor het onverwacht van boerenprotesten.
Mooi die opmerking over de rekenliniaal want een democratisering van de AI is dus alleen mogelijk als we de berekeningen begrijpen en ik herinner me dat weinigen ICT-touw aan mijn opinie over de bedot.com economie konden knopen. Hoe toevallig dat veel klanten uit de financiële sector van de diensten van Dataiku gebruik maken, de onbegrijpelijk woekerpolis heeft het vertrouwen van Henk en Ingrid ook geen goed gedaan. Maar leukste is de opmerking over mogelijke bias in 911, conclusie vergeet het lijfsbehoud van hulpverlener.
De diversiteitsdromers vergeten even dat vertrouwen te voet komt, die waarheid ontkennen maakt al je data onbruikbaar.