Dataopslagspecialist EMC introduceert de nieuwe EMC Greenplum Hadoop (HD)-appliance. Dit is een een datawarehousing (edw)-apparaat waarmee snel data kan worden geanalyseerd op het open source-platform Hadoop. Dit maakte de leverancier bekend op EMC World 2011, de jaarlijkse gebruikersconferentie die dit jaar wordt gehouden in Las Vegas.
EMC Greenplum HD is een platform voor het analyseren van ongestructureerde data. Het platform is nu geschikt gemaakt voor Hadoop, een Apache open source-project dat Java-programma's gebruikt. Hadoop heeft zijn basis in het MapReduce-algoritme. Programmeurs kunnen met MapReduce-applicaties, via een simple ‘drag-and-drop interface', data tussen Greenplum-systemen en Hadoop verplaatsen. Hierdoor kunnen ze sneller analyses uitvoeren, aldus EMC.
Hadoop wordt volgens EMC steeds vaker in zakelijke omgevingen gebruikt. EMC Greenplum HD kan worden gecombineerd met business intelligence-applicaties, zoals van SAS en Informatica.
EMC is niet de eerste datawarehousespecialist die Hadoop ondersteunt. In oktober 2010 besloot concurrent Terradata zijn edw-apparatuur geschikt te maken voor Hadoop.
Ongestructureerde data
EMC nam Greenplum in 2010 over. Greenplum maakt apparatuur dat geschikt is voor enterprise data warehousing (edw), zoals het analyseren van ‘big data'. De ‘massively parallel processing'-architectuur van Greenplum werkt tien tot honderd keer sneller dan traditionele databasesoftware. Belangrijke klanten van Greenplum zijn onder meer de aandelenbeurzen Nasdaq en Euronext, gratis chat- en telefonieprogramma Skype, telecombedrijf T-Mobile en mediabedrijf Fox Interactive Media.
EMC investeert veel in Greenplum en zijn technologie. Zo groeide het onderdeel van 150 naar zeshonderd werknemers in 2011. Sinds de overname zijn er nieuwe producten geïntroduceerd, zoals de Greenplum Data Computing-appliance, die gecombineerd kan worden met andere EMC-systemen en VMware-virtualisatieoplossingen.
Met de Greenplum-technologie wil EMC inspelen op groei van grote hoeveelheden ongestructureerde data die geanalyseerd moet worden. Van alle wereldwijde data is 80 procent ongestructureerd en groeit jaarlijks met 60 procent, aldus EMC.