Met machine learning (ml) kunnen bedrijven meer waarde uit hun gegevens halen. Ze kunnen er namelijk uit enorme hoeveelheden data nauwkeurige datamodellen mee creëren, op basis waarvan ze hun processen continu kunnen verbeteren. Dat gaat echter niet zomaar. Het vereist geavanceerde technologie en gespecialiseerde mensen. In dit blog leg ik uit hoe je slimmer en effectiever innoveert door machine learning in je database te integreren.
We staan pas aan het begin als het gaat om het optimaal binnen organisaties inzetten van technologie als machine learning en kunstmatige intelligentie. Toch kunnen we ook nu al een aantal belangrijke inzichten hierover delen, waarmee we stappen kunnen zetten om sneller en intelligenter te innoveren.
1.Data-analyse is complex
We horen al jaren dat big data en het verzamelen van grote hoeveelheden gegevens uiteindelijk tot de meest geweldige inzichten moet leiden, waarmee een organisatie slimmere beslissingen kan nemen. Wat veel van hen echter ontdekt hebben, is dat het verzamelen van de gegevens best gemakkelijk is, maar dat het intelligent opslaan en analyseren ervan – met enige betrouwbaarheid – behoorlijk lastig is.
2. Van machine learning naar inzichten
De grote uitdaging bij data-analyse is om patronen in gegevens te vinden. Het goede nieuws is dat machine learning precies daarvoor is ontworpen. Toch kan het behoorlijk lastig zijn om de complexe patronen en relaties die uit de enorme hoeveelheden gegevens opgediept worden, te vertalen naar bruikbare inzichten en regels voor je organisatie. Ook dat kan echter opgelost worden met moderne machine learning tools, die getraind kunnen worden om complexe inzichten uit data naar business rules te vertalen.
3. Inzichten zijn afhankelijk van datakwaliteit
Machine learning vereist grote hoeveelheden gegevens, maar de kwaliteit en de geschiktheid ervan voor het beoogde doel zijn net zo belangrijk. Kwalitatief goede gegevens zijn van cruciaal belang om met machine learning tot betrouwbare inzichten te komen. Je gebruikt immers dezelfde gegevens om het model te trainen als waar je het uiteindelijk op loslaat. De effecten van een slechte datakwaliteit worden hierdoor versterkt. Een van de belangrijkste beperkingen bij organisaties is dat veel van hen gegevens uit verschillende gescheiden systemen gebruiken. Dit vereist het kopiëren en transformeren van die data, wat de betrouwbaarheid ervan in gevaar brengt.
4. Roi van machine learning kan tegenvallen
Ondanks alle hype leveren de meeste investeringen in ai en machinaal slechts een zeer lage roi (return of investment) op. Daar zijn een aantal redenen voor, maar een van de meest gehoorde is dat veel organisaties geen vertrouwen hebben in de inzichten uit de ‘zwarte doos’ met machine learning-modellen. En als je de inzichten niet vertrouwt (ook al zijn ze juist), dan ga je er natuurlijk geen belangrijke beslissing mee nemen. Wat dit verergert, is dat het ecosysteem machine learning-tools ongelooflijk complex is. Organisaties vinden het daardoor lastig om machine learning in de context te zien van zaken als security en governance. Daarnaast is het moeilijk om personeel te vinden met de juiste vaardigheden om de systemen te bouwen en onderhouden.
5. Breng je algoritmes naar de data en niet andersom
Over security zegt men dat die ingebouwd moet zijn en minder effectief is als een toegevoegde oplossing. Hetzelfde kan van machine learning gezegd worden. De effectiviteit van machine learning is veel beter als de technologie zo dicht mogelijk bij de gegevens staat, bij voorkeur zelfs onderdeel van het dataplatform. We zien een toenemende trend dat organisaties voor een data hub-model kiezen, dat uniform platform biedt waarmee gegevens beveiligd, beheerd en geanalyseerd worden. Dit is een betrouwbare manier om de beste inzichten uit data te halen. Met een data hub kunnen organisaties machine learning inzetten om allerlei uitdagingen op te lossen, zonder in te leveren op security en governance.
6. Embedded machine learning optimaliseert de database
Wat veel mensen niet weten, is dat het integreren van machine learning in de database ook de kwaliteit van gegevens en de betrouwbaarheid van de gegevensmodellen kan verbeteren, en daarnaast de database zelf effectiever kan laten werken. Dat is mogelijk door workload- en toegangspatronen te monitoren, op basis waarvan de prestaties door automatische re-tuning van het systeem verbeterd worden. De database kan met machine learning ook efficiënter gemaakt worden om modellen van infrastructuur workload-patronen te ontwikkelen en te gebruiken om, bijvoorbeeld, automatisch de regels aan te passen voor data- en index-re-balancing.
7. Embedded machine learning helpt bij datacuratie
Als machine learning in de database is ingebed, kunnen organisaties hun vermogen om gegevens te verzamelen verbeteren door zaken te automatiseren als kwaliteitscontroles, harmonisatie, mastering en verrijking, naast vele andere complexe taken. Organisaties zijn zelfs in staat om bestaande, op regels gebaseerde mastering-processen uit te breiden om de nauwkeurigheid te verbeteren en om te gaan met uitzonderingen. Verder kan machine learning tijdens de modelleringsfase gebruikt worden om vast te stellen of bepaalde gegevens bijvoorbeeld persoonlijk identificeerbare informatie bevatten. En het kan ook helpen bij het classificeren van attributen en mapping- en modelleringsregels voorstellen. Belangrijk is dat deze modellen voortdurend worden getraind, zodat ze in de loop der tijd steeds slimmer worden.
8. Embedded machine learning helpt data scientists
Data scientists besteden een buitensporige hoeveelheid van hun tijd aan het cureren van gegevens. Volgens een artikel in de The New York Times besteden zij maar liefst tachtig procent van hun tijd aan het samenstellen van grote trainingssets met data. Als machine learning in het dataplatform is ingebed, wordt veel van dat werk voor hen gedaan. Data scientists houden daardoor veel meer tijd over voor het trainen en uitvoeren van datamodellen.
Geen sciencefiction
Machine learning en kunstmatige intelligentie worden tegenwoordig niet meer als sciencefiction beschouwd. De technologieën worden dagelijks gebruikt, en voor de meest uiteenlopende toepassingen. Dat betekent echter niet dat machine learning al volledig wordt benut, of dat het voor elke organisatie toegankelijk is. Door deze technologie in je database te integreren, wordt veel van de complexiteit ervan weggenomen. Dat maakt het voor organisaties makkelijker om de vruchten van machine learning te plukken en waardevolle inzichten uit hun gegevens te halen.