Talend (NASDAQ: TLND), leider in cloud en big data integratiesoftware, kondigt de Winter ’17 release van Talend Data Fabric aan. Dit platform vereenvoudigt de samenwerking tussen business en IT om datagestuurde besluitvorming te bevorderen. Het geïntegreerde platform biedt nieuwe functionaliteiten om big data te prepareren. Hierdoor krijgen alle medewerkers toegang tot grote datasets en hebben zij de mogelijkheid om deze data eenvoudig op te schonen, te bewerken en te analyseren. De nieuwe versie komt ook met een intuïtieve selfservice Data Stewardship app die organisaties helpt om boetes en sancties te voorkomen als gevolg van problemen met data-integriteit. Ook is Winter ’17 uitgerust met Spark 2.0 innovaties voor Talend Big Data en Talend Integration Cloud. Hiermee versnellen organisaties hun bedrijfsprocessen en kunnen zij hun omgeving eenvoudig moderniseren om het hoge tempo van de technologische ontwikkelingen bij te benen.
Gartner research stelt: “Tussen nu en 2018 is negentig procent van alle data lakes niet langer bruikbaar, omdat ze veel informatie bevatten die is verzameld zonder duidelijke use case.”1 Hoewel data lakes diverse voordelen bieden en vaak een eerste stap zijn in de digitale transformatie van organisaties, brengen ze ook nieuwe uitdagingen met zich mee op het gebied van governance, kwaliteit, herkomst en toegang.
Ashley Stirrup, chief marketing officer bij Talend: “Organisaties moeten de manier waarop zij data inzetten en uitwisselen ingrijpend veranderen om een boost te geven aan de digitalisering. Het mooie van een data lake is dat het niet uitmaakt of deze is ondergebracht in Hadoop, on premise, of in de cloud. Door de centrale opslagplaats kunnen organisaties aanzienlijk meer informatie opslaan tegen lagere kosten en meer inzichten verkrijgen. De nieuwe Talend Data Fabric stoomt organisaties klaar voor de volgende fase in hun digitale transformatie. Door de samenwerking tussen business en IT te bevorderen kunnen data lakes transformeren naar relevante en betrouwbare data, waardoor medewerkers sneller en beter gefundeerde beslissingen nemen.”
Datapreparatie voor Big Data
De nieuwe versie van Talend Data Fabric stelt de IT-afdeling in staat om de business toegang te geven tot data en functionaliteiten waarmee zij data sneller kunnen prepareren en opschonen. Met de nieuwe mogelijkheden voor datapreparatie voor Talend Big Data kunnen organisaties:
• Toegang krijgen tot iedere databron, zowel in Hadoop, de cloud of traditionele databases. Ook kunnen gegevens gedeeld worden met individuele of groepen gebruikers om samenwerking aan te moedigen.
• Op grote schaal data prepareren met Spark 2.0 en Hadoop
• Een vooraf geconfigureerd datawoordenboek om de betekenis van ruwe data uit data lakes automatisch te herkennen. Gebruikers kunnen ook hun eigen ‘vocabulaire’ (zoals productcodes en -namen) hieraan toevoegen
• Nieuwe datadefinities verwerven met behulp van crowdsourcing via open data en/of de Talend Community
Data Stewardship – goede en opgeschoonde data
In een markt waarin de concurrentie moordend is, wordt het verschil tussen digitale leiders en achterblijvers bepaald door de manier waarop organisaties hun data benutten. Talend’s nieuwe Data Stewardship app is een van de eerste selfservice tools die organisaties in staat stelt om data op efficiënte wijze te verzamelen en beheren in de volledige levenscyclus. Met deze app kunnen gebruikers ervoor zorgen dat de data in de data lake opgeschoond is en voldoet aan de compliance eisen. Hierdoor kunnen problemen met data-integriteit voorkomen worden. De app helpt organisaties om hun data-compliance op orde te krijgen, met het oog op hoge boetes als gevolg van schending van richtlijnen zoals de General Data Protection Regulation (GDPR) of Sarbanes-Oxley. Door data-governance toe te wijzen aan medewerkers binnen afdelingen die vertrouwd zijn met de data, creëert de nieuwe applicatie een samenwerkingsomgeving, waarin de data betrouwbaar is.
Met de Data Stewardship app kunnen medewerkers governance in elke data-integratie workflow toevoegen en bepaalde datasets isoleren die handmatig beheerd, beoordeeld of gevalideerd moeten worden. De applicatie deelt deze taken vervolgens in workflows in, wijst de kwaliteitscontrole toe aan de meest geschikte medewerker en stelt regels in om te bepalen welke data moet worden opgeschoond en gevalideerd. Talend Data Fabric gebruikt tevens machine learning-technologie om best practices voor databeheer te identificeren, zodat enorme datasets sneller en intelligenter worden verwerkt. De toegevoegde ondersteuning voor Apache Atlas biedt organisaties meer inzicht in de herkomst van data en informatiestromen binnen Hadoop, ter verbetering van risicobeheer en compliance.
Stewart Bond, research director bij IDC’s Data Integration Software Service: “Veel organisaties starten met data-governance initiatieven vanwege een incident of omdat medewerkers data onbetrouwbaar vinden. Sommige organisaties zien data-governance als een IT-probleem in plaats van een business probleem. De beste manier om grip te krijgen op data-governance is om medewerkers van diverse afdelingen bij het data stewardship-proces te betrekken. Medewerkers met goede kennis van de data kunnen de betrouwbaarheid ervan vergroten door deze te verrijken, op te schonen, te standaardiseren en certificeren. Dit maakt het mogelijk om meer datagedreven beslissingen te nemen.”
Een geruststellende investering
Big data en cloud-technologieën ontwikkelen zich in hoog tempo. Sommige organisaties vragen zich af of de technologieën waarin zij nu investeren, niet over een paar maanden al zijn verouderd. Talend Data Fabric is gebaseerd op open source en open standaarden en kan zich daardoor eenvoudig aanpassen aan nieuwe ontwikkelingen. De voortdurende innovaties uit de community van open source programmeurs en diverse big data en cloud partners zorgen ervoor dat Talend Data Fabric de laatste technologische ontwikkelingen kan bijbenen. Talend Data Fabric biedt daarnaast een modelgestuurde codegenerator. Dit maakt het aanpassen van de oplossing aan nieuwe technologieën eenvoudig. Zo kan de code die nodig is om een taak of applicatie van Spark 1.6 om te zetten in Spark 2.0, met een paar muisklikken worden gegenereerd. Al deze functies bieden organisaties de wetenschap dat hun technologische investeringen ook op de lange termijn relevant blijven.
Prijzen en beschikbaarheid
Talend Data Fabric is verkrijgbaar vanaf 19 januari 2017. Klanten die een licentie aanschaffen voor de nieuwe versie van Talend Data Fabric ontvangen twee aanvullende licenties voor Talend Data Stewardship en Talend Data Preparation. Neem voor informatie over prijzen en pakketten contact op met een verkoopmedewerker van Talend via sales@talend.com.
Geïnteresseerden kunnen zich voor meer informatie over alle voordelen en mogelijkheden van de Winter ’17 release van Talend Data Fabric inschrijven voor het live webinar “Talend Winter ’17: Transform your data lake to accelerate insight” op donderdag 19 januari om 10:00 GMT.
1 Gartner, Inc., “Defining the Data Lake,” Nick Heudecker, Mark A. Beyer, november 2016.