Er ligt veel kapitaal verscholen in ongestructureerde informatie, vooral in teksten. Deze informatie kan worden ontleed met datawarehousing-applicaties en business intelligence (bi). Zo kunnen bedrijven sneller analyseren wat consumenten denken van hun producten door bepaalde sentimenten uit teksten te analyseren met een zogenaamde ‘sentiment score’.’ Dit zegt Stephen Brobst, cto van de Amerikaanse datawarehouse-leverancier Teradata. Hij sprak met de redactie van Computable over recente ontwikkelingen in de wereld van datawarehousing en business intelligence. Daarbij ging het onder andere over de analyse van ongestructureerde informatie, zoals e-mails en sociale media.
Teradata richt zich op de analyse van gestructureerde informatie, aldus cto Stephen Brobst. Ongestructureerde informatie, ofwel ‘unstructured data', past niet in een afgekaderd datamodel. Het gaat hierbij meestal om spraak en teksten uit e-mails. Volgens Brobst ligt er echter veel kapitaal verscholen in ongestructureerde informatie, vooral teksten. ‘Deze informatie kan worden ontleed met datawarehousing-applicaties en business intelligence (bi). Zo kunnen bedrijven sneller analyseren wat consumenten denken van hun producten door bepaalde sentimenten uit teksten te analyseren met een zogenaamde ‘sentiment score'.'
Politie
De analysetechnologie kan bijvoorbeeld interessant zijn voor nationale veiligheidsdiensten of de politie, die er verdachten mee op het spoor kan komen. Maar ook voor commerciële bedrijven is het ook interessant, bijvoorbeeld voor verzekeringsmaatschappijen die aan de hand van spraak kunnen horen of een klant wel of niet eerlijk een schadeclaim indient. Brobst verwacht dat dit soort applicaties vanuit de cloud, zowel private als de openbare, vaker worden aangeboden.Teradata werkt op dit gebied samen met technologiepartners zoals Attensity en SAS. Deze twee bi-spelers integreren hun algoritmen in de technologie van Teradata. Attensity heeft technologie in huis die gevoelens uit e-mails kan analyseren.
Woedende moeders
Volgens Brobst is er behoefte om meer ongestructureerde informatie te converteren naar een gestructureerd formaat, vooral gegevens die afkomstig zijn uit sociale netwerken. Op sites zoals Facebook reageren klanten vaker, sneller en kritisch op ontwikkelingen van bedrijven of producten. De cto haalt als voorbeeld ‘het Pampers-incident' aan. ‘In de Verenigde Staten werd begin 2010 een nieuw soort Pampers door leverancier Procter & Gamble geïntroduceerd; de nieuwe ‘Dry Max'. Deze luier werd echter op sociale netwerken als Facebook en Twitter afgemaakt door woedende moeders die klaagden over de luiers. Hun baby's zaten onder de uitslag. Sommige boze moeders openden zelfs een ‘Anti-Pampers' Facebook-account, waar binnen de kortste keren 11.000 mensen lid van werden.'
Volgens Brobst moeten bedrijven daarom sneller inspelen op gegevens die uit dergelijke acties op sociale media vrijkomen. ‘Vroeger kwamen klachten binnen bij de consumentenservice van Pampers en waren ze niet meteen bij het publiek bekend. Door de komst van sociale netwerken zijn merken en bedrijven echter veel gevoeliger geworden voor acties van ontevreden consumenten.'
Advanced analytics
Brobst ziet een toenemende interesse in advanced analytics: het samenstellen, wijzigen en beheren van analyseaanvragen. Dat gaat verder dan alleen maar voorgeïnstalleerde analyseapplicaties of spreadsheets, zoals Excel, waarbij rapportages, key performance indicators en balanced scorecards zijn samengevoegd. Volgens Brobst is het beter om nieuwe vraagstellingen op te zetten die nieuwe inzichten bieden, in plaats van de standaardvragen die al in de voorgeïnstalleerde analyseapplicaties of spreadsheets zitten.
Het begint inderdaad met luisteren. Voor een betrouwbare en nauwkeurige sentimentswaarde moet je in Nederland wel een tool hebben dat de Nederlandse taal (en dat gaat een stuk verder dan het lexicon – denk aan scepsis in taalgebruik) in de vingers heeft..