Een grote trend als big data zou ondenkbaar zijn zonder de technologische ontwikkelingen van het voorbije decennium. Denk aan oneindig schaalbare cloudplatformen, razendsnelle ssd-storage, in-memory databases en glasvezelverbindingen. Een minstens zo interessante trend is de NoSQL-technologie, die nu operationeel en transactioneel inzetbaar is. Bedrijven kunnen daardoor al hun cruciale bedrijfsgegevens bevrijden, samenvoegen en inzetten voor innovatie.
Gevestigde organisaties, zoals banken, verzekeraars en overheden, hebben vaak een complexe infrastructuur waarbinnen ze hun gegevens opslaan in datasilo’s. Wil je deze data bevrijden en gaan samenvoegen om business waarde te creëren? Dan moet je ze eerst naar een nieuwe silo exporteren via een tijdrovend en kostbaar extract transform load (etl)-proces. Deze operationele flessenhals zorgt voor veel problemen, zoals bijvoorbeeld bij het voldoen aan nieuwe wettelijke rapportage-eisen als de GDPR/AVG en MiFID II. Het remt bedrijven bovendien af bij het starten van innovatieve projecten op basis van gegevens uit legacy-systemen. Vroeger was etl de enige manier om deze data op een moderne manier te gebruiken. Door de technologische vooruitgang is de NoSQL-database nu echter operationeel en transactioneel inzetbaar. Gegevens uit alle silo’s zijn zonder aanpassingen aan de originele datastructuur bij elkaar te brengen in een zogeheten operationele datahub. Hiermee worden die gegevens bevrijd uit hun oude datasilo’s en ontsloten voor de realtime-verwerking en nieuwe toepassingen.
De NoSQL-database, de motor achter een operationele datahub, is de evolutie van de klassieke relationele database. Het voordeel van NoSQL is dat dit systeem niet gebonden is aan vaste databaseschema’s. Er zijn flexibel allerlei soorten gegevens in op te slaan, van video’s en sociale-mediaberichten tot aan xml-bestanden en pdf’s. Maar -nog belangrijker – ook gegevens uit legacy-systemen zijn één-op-één over te zetten, inclusief alle metadata. Er zijn daardoor geen aanpassingen aan de bestaande applicaties nodig. De organisatie kan daardoor als vanouds blijven functioneren, maar de gegevens uit de oude storagesilo’s zijn nu realtime inzetbaar, bijvoorbeeld voor data-analyse of het ontwikkelen van nieuwe diensten met moderne programmeertalen. Bovendien kunnen de gegevens nu flexibel op allerlei verschillende storageplatformen opgeslagen worden. Investeren in een operationele datahub is voor gevestigde organisaties die dromen ooit gebruik te maken van big data of IoT een eerstvolgende stap. Niet voor niets wordt MarkLogic steeds meer gezien als het bedrijf dat data bevrijdt uit verouderde datasilo’s en beschikbaar maakt voor nieuwe innovaties.
(Deze bijdrage is afkomstig uit Computable Magazine, editie 01/2018.)