Dataopslagleverancier EMC introduceert het Greenplum Unified Analytics Platform (UAP) voor de ondersteuning van big data analytics. Dit single unified platform is uitbreidbaar naar andere tools en vereenvoudigt het achterhalen en delen van inzichten in big data, aldus de leverancier.
Het EMC Greenplum Unified Analytics Platform is een combinatie van business intelligence, analtycis, dataopslag en big data technologieën zoals de dataverzamelingstechnolgie Hadoop. EMC zegt dat Greenplum een non-monolitische benadering hanteert tot big data analytics en gebruikt zowel de gestructureerde als ongestructureerde data (webpagina, video, foto's) van een bedrijf. Met de Greenplum UAP kunnen organisaties volgens EMC inzicht krijgen in de grote datavolumes die bestaan uit gestructureerde als ongestructureerde data.
De EMC Greenplum Chorus 2.0 oplossing biedt hierbij een enkelvoudige interface voor alle data van een organisatie samen met virtuele databases voor onderzoek en innovatie, en sociale samenwerking voor inzichten en analyse, aldus EMC. Klanten kunnen de EMC Greenplum integreren in hun bestaande hardware.
Hadoop
Hadoop is een op MapReduce geïnspireerd opensource Java-framework voor de bouw van data-intensieve gedistribueerde applicaties. MapReduce is een door Google geïntroduceerd framework voor het in korte tijd uitvoeren van berekeningen over heel grote hoeveelheden data van vaak meerdere petabytes. Met MapReduce kan in korte tijd veel data worden verwerkt doordat het een grote taak opsplitst in deeltaken. Die deeltaken worden over meerdere computers verdeeld. De computers voeren vervolgens de deeltaken gelijktijdig uit (distributie). Dit via de functies map en fold (reduce) die bekend zijn uit de functionele programmeertalen. Als een van de computers het begeeft tijdens het uitvoeren van zijn deeltaak dan wordt die deeltaak automatisch door een andere computer overgenomen. Dit maakt het systeem zeer robuust.