Amazon EC2-cloud crasht

22 april 2011 - 14:313 minuten leestijdOpinieCloud & Infrastructuur

In Amerika was op 21 april en in Nederland was op 22 april een van de grootste ict-nieuwsberichten dat Amazon EC2 cloud plat lag. Honderden misschien wel duizenden websites waren niet meer bereikbaar en ook cloudapplicaties waren niet meer bereikbaar.

Onder andere de website van de New York Times had veel last van de storing. Mensen konden de artikelen wel lezen, maar konden niet reageren op berichten en ook het inzenden van stukken werkte niet meer. Deze faciliteiten die databasegerelateerd zijn geven dan aan dat de relationele databasesystemen niet meer werkten en aangezien de meeste websites daar toch wel gebruik van maken was deze storing verregaand.

Problemen voorkomen

Natuurlijk wordt er dan gespeculeerd over wat er gebeurd is. Heeft een systeembeheerder een fout gemaakt of zijn ongeteste service packs uitgerold zonder getest te zijn? Allemaal vragen waar we waarschijnlijk nooit de waarheid over horen. Wel zet het bedrijven aan het denken. Als ik mijn hele business in de cloud plaats, wat zijn dan de risico's? Kan mijn personeel nog werken? Wat moet ik inregelen om deze problemen te voorkomen en kan ik deze problemen eigenlijk wel voorkomen als ik de cloud in ga?

Menig aanbieder van cloudoplossingen zal de komende maanden toch antwoorden moeten gaan geven op deze vragen. Tijdens een bezoek aan een Belgische klant die het nieuws eerder hoorde dan ik, werd ik er al mee geconfronteerd. Aangezien wij ook cloudoplossingen op de markt brengen, vroeg de klant mij om een reactie.

Mix van voordelen

De kracht van een oplossing zit hem in het hybride stuk. En dat is nu precies waar bedrijven naar moeten kijken. Niet op één paard wedden, maar op twee paarden. Of, om het in casinotermen te houden, spreid je kansen. Gartner heeft in diverse rapporten reeds uitgesproken dat bedrijven die kijken naar cloudoplossingen moeten uitkijken naar hybride omgevingen waarin er een gezonde mix is van private en public. Private heb je zelf in handen en beheer je ook zelf. Public word vaak gekozen voor gemakkelijk, goedkoop en overal bereikbaar. En met een mix kun je van alle voordelen genieten.

Stel je eens voor dat je als gebruiker naar een website gaat en nadat je veilig bent ingelogd je kunt kiezen hoe je je werk van die dag wilt gaan verrichten. Misschien kies je voor een full desktop in de private cloud die de mogelijkheid biedt om op dezelfde manier te werken zoals je op kantoor werkt. Maar je kunt ook kiezen uit gepubliceerde applicaties en dan heb je zelfs de keuze uit public en private. Wat je wilt is een portal die is gebouwd om een naadloze integratie van VDI, gepubliceerde applicaties en cloudapplicaties te integreren en het beheer van het portaal moeten administrators gewoon vanuit de cloud kunnen doen. Klanten spreiden hun kansen door te werken via zo'n hybride cloudportaal en hoeven niet bang te zijn voor een crash als bij Amazon. De gebruikers kunnen gewoon verder werken. Ze missen echter wel bepaalde applicaties of ze kunnen even niet bij hun cloudmail, maar de lokale systemen draaien netjes verder. En doordat de data niet alleen in de cloud staat, maar ook op interne systemen, is ook de data dubbel gespreid.

11 reacties op “Amazon EC2-cloud crasht”

Sandor Nieuwenhuijs schreef:

22 april 2011 om 18:35

Hoewel er weinig tot geen informatie beschikbaar is over de reden van deze storing, maakt het toch een risico duidelijk. Veel gehoord argument tegen bezwaren rondom veiligheid en beschikbaarheid van de Cloud is dat dit een professioneel beheerde (en beveiligde) omgeving is. Dat mag dan wel waar zijn, maar de impact van een storing is wel vele malen groter. Niet alleen bij een storing, ook zal een grote Cloud omgeving vele malen interessanter zijn voor hackers, immers als je daar binnendring gaat er een wereld voor je open.

Log in om te reageren
nick schreef:

22 april 2011 om 21:47

Kwestie van goed beheer en risicospreiding. Als je als gebruiker van AWS geen redundantie toepast over meerdere regions, dan valt AWS niets te verwijten maar moet je je aan je eigen risicobeheer een betere invulling geven.

Log in om te reageren
Michiel Steltman schreef:

23 april 2011 om 08:42

Grappig is te zien dat risicobeheer & business continuity nu zo prominent op de kaart komen terwijl die bij themas on-premise nooit echt een thema waren.
In de traditionele on-premise situaties was immers traditionele uitwijk voor MKB onbetaalbaar en werd in de praktijk dus alleen geregeld door grote rekencentra van banken etc.
Ik zie dit dus juist als een verdienste & voordeel van de cloud: o.a. door de lagere kosten worden business continuity scenarios weer haalbaar & betaalbaar.
@Sandor wil ik vragen: wat is hier dan je punt, is de grote afhankelijkheid van het electriciteitsnet een reden om een eigen centrale te gaan bouwen of om een UPS te gaan kopen?

Zo werkt de DHPA (branchorganisatie van hosters / cloud suppliers) al aan een escrow / continuity model: via een garantiefonds worden voor een kleine meerprijs op de fee, de data, images en capaciteit beschikbaar gehouden bij een ander lid.
Kortom: impliciete business continuity, dankzij de cloud!

Log in om te reageren
Erik schreef:

23 april 2011 om 13:58

@michiel,
Het escrow continuity plan dat diverse hosters aan het ontwikkellen zijn is een hele goede stap in de richting, maar juist daar ging het bij Amazon fout.
Juist de business continuity rules hebben een domino effect van her creeeren van machines teweeg gebracht en dat veroorzaakte dat andere datacenters ook onderuit gingen.
Een bedrijf als Greenclouds heeft heel veel belovende methodes, en ik denk dat hun business model een grote verandering teweeg kan gaan brengen.
Voorlopig houd ik mijn data in eigen beheer en regel mijn backups goed in. En test ik iedere 3 maanden een restore zodat ik niet alleen backups maak maar ze ook echt kan gebruiken.

Log in om te reageren
Peter schreef:

25 april 2011 om 22:58

Cloud computing… de nieuwe internet buble. En de volgende of was het de vorige buble: Server based computing. Dit zijn marketing producten. Niets nieuws..
Buitendienst medewerkers halen hun data op via een beveiligd VPN, bij het eigen bedrijf. Backup’s tevens extern opslaan. Waarom cloud computing, als bedrijven niet massaal willen overstappen op telewerken? Ze zitten toch op de werkplek…. zo, exit de cloud.

Kijk nu eens naar telebankieren. De “cloud” van de Rabobank haalde gegevens van gebruikers door elkaar. De oorzaak weten ze nog steeds niet.

Al je bedrijfgegevens in een cloud die tevens gebruikt/gedeeld wordt met nog 1000 andere bedrijven?
Brrr.. de nachtmerrie voor de systeembeheerders.
Van mij mogen ze… Begin ik een bedrijf in het “onderscheppen” van concurentie gegevens…

Ha, just a man in the middle, en je komt alles te weten.

Log in om te reageren
Henri Koppen schreef:

26 april 2011 om 19:56

Ik lees een hoop onzin. De titel “Amazon EC2-cloud crasht” is al onjuist en daaronder wordt meteen wat eigen marketing bedreven.

Vul dit aan met aan paar angsthazen die bang voor cloudcomputing zijn en iemand die minder goed op de hoogte is zou het nog geloven ook.

Netflix is een bedrijf dat voor streamen van films en website volledig gebaseerd is op Amazon Webservices. Ging die site plat? Nee.

Als je een server instance plaatst “in the cloud” in 1 regio en zonder na te denken over diverse scenario’s. Dan ben je inderdaad uit de lucht als een datacenter niet goed functioneert. Dit is by design. Pas als je netjes de architectuur richtlijnen volgt waar Amazon heel veel documentatie en voorbeelden voor verschaft, dan was er niets aan de hand.

Ja, heel vervelend dat ze ineens zo’n grote storing hadden, maar ze hebben niet gefaald.

En waarom duiken meteen al die azijnplassers erop als er een keer iets fout gaat? Een beetje sneeuw en heel Nederland ligt op zijn gat. Shit happens.

Wie nooit fouten maakt, heeft nooit iets nieuws geprobeerd. De wereld is niet veranderd door mensen die overal tegen zijn.

De voordelen van cloud computing zijn zo groot dat het gewoon gaat gebeuren: Met zijn allen de cloud in 🙂

Overigens las ik vandaag de term Internet Computing en die “jeukt” wellicht wat minder dan cloud computing.

Log in om te reageren
bart schreef:

27 april 2011 om 07:04

Nick en Henri hebben gelijk. De enige reden waarom die websites/applicaties down gingen is omdat de architectuur waarop ze draaien niet redundant was opgezet door de klant. That’s it. Een AWS structuur is 10 keer beter dan de gemiddelde server infrastructuur in bedrijven, op alle vlak: architectuur, security, backup etc .. De enige toekomst is de cloud, en dan nog de public cloud. Geen enkel (klein) (hosting)bedrijf kan een architectuur aanbieden zoals bedrijven als Amazon. Nu nog de juridsiche obstakels voorbij geraken (en dan nog), en er is echt geen argument meer om je it infrastructuur niet in de cloud te plaatsen. Al de rest is job/income protection …

Log in om te reageren
Henri Koppen schreef:

27 april 2011 om 14:32

Oja, nog een aanvulling op het artikel van Erik Westhovens zelf.

Ik ben het namelijk pertinent niet eens met een hybride oplossing. Hier heb je nu juist *alle* nadelen te pakken. Je gaat en zelf beheren en dingen in de cloud zetten en de koppelingen onderhouden. Hiermee verlies je nu juist het voordeel van agile en lean bezig zijn en maak je alleen maar meer werk.

Deze fout wordt ook zeer veel gemaakt door bedrijven bij het aanschaffen van software: Ze kiezen een standaard pakket en laten daar maatwerk op bouwen. Hiermee missen ze het voordeel van eigen controle en software die volledig aansluit bij de bedrijfs (zelf ontwikkelen dus al dan niet met een partner) en ze missen het voordeel van standaardsoftware; relatief goedkoop, getest en voortgang in toekomstige ontwikkelingen door nieuwe versies (dit betekent vaak wel een organisatorische verandering).

Helaas lijkt het erop dat helemaal overgaan op de cloud niet mogelijk is en niet aansluit bij de huidige realiteit. Veel productiesoftware is er domweg gewoon nog niet en zodoende zijn vooral generieke diensten wellicht in de cloud af te nemen.

Hybride heeft dus wel een plaats, alleen geloof ik niet dat je er snel een kostenbesparing mee realiseert.

Log in om te reageren
Erik schreef:

27 april 2011 om 17:06

beste Henri,

Graag ga ik de uitdaging aan om je te laten zien wat hybride cloud is en dat je er zeker mee kunt besparen. Het hybride model bied juist een uitweg om naar de cloud te gaan waarbij je toch controle kunt houden. Echter ga je een SLA aan met je provider en leg je daarin vast wat wel en niet tot ieders verantwoordlijkheden behoren.
Amazon heeft vele datacenters en alleen north carolina heeft een storing gehad.
Andere datacenters zijn er wel iets door geraakt maar niet in een mate dat er outages waren.
Een veel gebruikte en goed ingeregelde site was Cydia. die heeft in totaal 86 uur eruit gelegen. Deze draaide in drie datacents van Amazon en juist deze drie zijn geraakt door de outage. Domme pech? Of?

Log in om te reageren
Henri Koppen schreef:

28 april 2011 om 13:26

Dag Erik,

We zijn ge-linked-in, en ik neem contact op voor een afspraak.

Een SLA is belangrijk, maar is geen garantie dat er geen downtime ontstaat. Hooguit de vergoeding die je krijgt als een geboden dienst de SLA niet goed na kan komen.

Ja AWS is harder onder druk komen te staan dan zou moeten waardoor er wel degelijk problemen ontstonden. Maar Cydia was *niet* goed ingeregeld, en zoals je aan de commentaren kunt zien werd dat vooral gedaan door 1 man. Ieder zijn specialiteit zal ik maar zeggen.

http://goo.gl/T1JbS
http://goo.gl/Sqe3j

Het punt is dat hoewel je met weinig mensen heel veel servers en services in de lucht kan houden, het nog steeds complexe materie is en dat het niet zo gemakkelijk is om een goede failover te maken en dat er soms ook handmatige actie nodig is voor als er iets goed fout gaat.

Gebeurtenissen zoals die van vorige week zijn gewoon erg belangrijke leermomenten voor alle partijen.

Overigens, check ik dit artikel doormiddel van een reminder in mijn agenda. Ben ik nu gek of zijn er wel betere manieren om op de hoogte te blijven van reacties hierop?

Log in om te reageren