Datawarehouse- en business intelligence-oplossingen kunnen beter niet vanuit een publieke cloud worden aangeboden. Een on-premise server of een private cloud is beter. Dit zegt Teradata's chief development officer (cdo) Scott Gnau. 'Het heeft te maken met beveiliging en te weinig input/output (i/o) prestaties van cloudnetwerken. Daarom zal Teradata nog niet investeren in datawarehouse oplossingen voor publieke clouds.'
Volgens Gnau is het nog niet verstandig om aan datawarehouse oplossingen vanuit een publieke cloud aan te bieden. Er is niet voldoende beveiliging in publieke cloudnetwerken en daarom willen klanten van Teradata, zoals financiële instellingen, daaraan niet beginnen. Verder is er te weinig breedband beschikbaar voor high performance computing (hpc) voor de grote hoeveelheden data. Zo zijn de input/output eisen rond datawarehousing veel hoger dan bij normale webverkeer, aldus Gnau. Bij weinig i/o breedband is dat funest voor het analyseren van data. Verder biedt de publieke cloud geen economisch voordeel voor Teradata, aldus Gnau.
Service Level Agreement
Teradata zegt al sinds 1995 een datawarehouse oplossing vanuit een private cloud te bieden. Dat willen klanten weer wel, aldus Gnau. Volgens hem was de Teradata V2-versie in 1995 een van de eerste wereldwijde datawarehouse cloudoplossingen. Gnau benadrukt overigens dat, als cloudnetwerken voldoende input/output kunnen leveren met een hoge service level agreement (sla), Teradata een publieke datawarehouse cloud wil bouwen. Volgens Gnau bieden de huidige Teradata appliances een hoge utilisatie van 90 tot 95 procent vanuit een private cloud. Dat is meer dan de hardware utilisatie die vanuit een publieke cloud zou worden aangeboden waarbij vaak gebruikt wordt genaakt van virtuele machines (vm's). Verder zouden klanten van Teradata nog weinig interesse hebben voor datawarehousing in de cloud.
De opmerkingen van Gnbau staan haaks op de strategie van concurrenten zoals IBM, Microsoft, HP, Oracle en SAP Sybase die cloudplatformen ontwikkelen waarop business intelligence kan worden aangeboden.
Zoals zo veel zaken gaat het hier om de juiste toepassing op het juiste moment. Net zo goed als cloud computing geen Haarlemmer olie is voor alle capaciteitsproblemen.
In gevallen waar vertrouwelijkheid van gegevens een grote rol spelen is het inderdaad niet verstandig om in zee te gaan met een techniek die deze vertrouwelijkheid niet kan garanderen. Daarmee beperk je meteen ook de mogelijkheden van toepassing van een cloud techniek: als de gegevens vertrouwelijk zijn wil je eigenlijk ook niet dat een deel van deze gegevens ergens op de wereld belanden om te worden gebruikt. Immers een applicatie ergens in de cloud kan draaien op een server in een land die deze gegevens graag zelf wil gebruiken. Als voorbeeld van het laatste kan worden gedacht aan creditcard gegevens en de Verenigde Staten.
Voor algemene toepassingen als zoekmachines (Google, Alta Vista, Bing, etc.) waarbij pentabytes aan gegevens moeten worden bewaard en bewerkt is een cloud oplossing een zegen. Daarbij spelen zaken als vertrouwelijkheid van de gegevens veel minder.
De term “cloud” is overigens een zeer ambigue, grote bedrijven kunnen zeer snel een business case opstellen waarbij een private cloud (dus binnen de virtuele muren van het bedrijf) snel rendabel wordt. Als de oplossingen van de genoemde bedrijven iets beter zouden worden belicht zou vermoed ik duidelijk worden dat deze zich voornamelijk richten op deze private cloud oplossingen. En daarbinnen zijn cloud data warehouses weer wel van toepassing.
De opmerkingen van Gnau staan naar mijn mening daarmee niet haaks op de strategie van de genoemde bedrijven, ze staan zelfs in lijn daarmee; als je maar beseft dat zij zich richten op de grote bedrijven (Fortune 500 zal ik maar zeggen).