ICT is krachtig, maar AWS’ grote cloudstoring bewijst weer de macht van de mens. Dit is de discussiestelling die Computable-lezers vandaag krijgen voorgelegd.
‘Gansch het raderwerk staat stil, als uw machtige arm het wil’, was de historische uitspraak van de Nederlandse socialistische voorman Pieter Jelles Troelstra bij de grote spoorwegstakingen van 1903. Deze wijsheid over arbeidersmacht is tegenwoordig nog altijd valide, ook voor de ict. De kracht en macht van automatisering, inclusief cloud computing, blijkt nog altijd ondergeschikt aan de impact van menselijke fouten. Zie maar de grote cloudstoring die een Noord-Amerikaanse regio (US-EAST-1) van Amazon Web Services (AWS) heeft getroffen.
Die urenlange uitval heeft diverse sites, apps en online-services lamgelegd en anderen deels verstoord. Ondanks de moderne mogelijkheden voor weerbarstigheid, redundantie, zelflering, zelfherstel en failover gaan ict-systemen toch wel eens onderuit. Door de mens, die ook de oorzaak was voor AWS’ S3-storing, blijkt uit de post-mortem van de cloudaanbieder. Een beheerder bij Amazon heeft een typefout gemaakt bij het invoeren van een commando tijdens regulier systeemonderhoud. De mens is en blijft de zwakste schakel voor ict. Wat vind jij?
Summary of the Amazon S3 Service Disruption in the Northern Virginia (US-EAST-1) Region // tl;dr humans https://t.co/bsGrGhgccj
— Steven Sinofsky ॐ (@stevesi) March 2, 2017
Wat een leuk verhaal over deze storing. Zeker, de mens is een kwetsbare factor of het gaat om storingen. Ook al is de computer een lastig beestje. Doet me denken dat ik ooit begon met het ‘rm -f’ commando onder Linux en me bedacht om eerst eens naar de omvang van een andere te kijken en vervolgde met ‘du -sh *’. Daar gingen de backups. Dan voel je je niet fijn als je dat moet vertellen. Kostte me drie weken om het terug te toveren, online backup beheer werkte niet maar toen de tape-man de de tape aandrukte was gelukkig alles weer terug.
Eigenlijk is het ook een slecht design (dat gaan ze nu pas aanpassen?). Vanuit een heel “hoog over” beschouwing maakt Amazon een dienst. Amazon is heel groot en bedient vele klanten. Dienst kapot, tja dan ook veel klanten een probleem. Kortom: schaalvergroting is altijd een risico op zich. Nu pas nadenken dat de verwevenheid van al die systemen met elkaar een risico vormt, getuigd bij mij toch van een nonchalante inrichting van het geheel. Het is ook altijd mijn angst; hoe ga je zo iets groots managen? En nee, niet door er nog meer technologie er tegen aan te smijten. Dat getuigt van tunnelvisie.
Tja, dit was een gevalletje IAM account met teveel leverage.
Die fout wordt ook maar 1 keer gemaakt.
Het meest bijzondere aan de storing vond ik dat er niet ineens allemaal geluiden kwamen van “zie je nu wel dat de cloud niet goed is!” En dat is wel de eerste keer.
Sh!t happens, je kunt niet alles voorkomen en als je een nieuw scenario ontdekt maak je daar weer een procedure van die zo mogelijk technisch geïmplementeerd wordt. Zo wordt het systeem nog betrouwbaarder.
Zie je nu wel dat de cloud niet goed is!
Dino 🙂 De cloud is amoreel 😉
Techniek is niet goed of fout, degene die de techniek gebruikt is degene die verantwoordelijk is voor de fout(en) en de gevolgen. Is degene die de invoer deed fout? Ja, maar de grotere fout zit op een “hoger” niveau, niet bij degene die het programma schreef, niet bij degene die het programma ontwierp, niet bij degene die etc. Bij wie dan wel? Bij degene die besliste om een niet intrinsiek veilige techniek toch te gebruiken…en die wist niets van techniek…
De moraal? Kies maar: 1. als ik er maar aan verdien, de slimste verdient het er met de winst vandoor te gaan; 2. het wordt wel heel duur als je alles moet controleren; 3. het is onontkoombaar door de toenemende complexiteit; 4. het is onontkoombaar door de toename van het onverwachte/onvoorziene/oneigenlijke gebruik; 5. de mens maakt nu eenmaal fouten; 6. vul uw eigen argument in…
De oplossing is afhankelijk van de morele argumentatie…Kan ik er wat aan doen? Jawel, maar niet alleen. Wil ik er wat aan doen? Jawel, wie doet er mee?
Techniek is niet goed of fout, degene die de techniek gebruikt is degene die verantwoordelijk is voor de fout(en) en de gevolgen. Is degene die de invoer deed fout? Ja, maar de grotere fout zit op een “hoger” niveau, niet bij degene die het programma schreef, niet bij degene die het programma ontwierp, niet bij degene die etc. Bij wie dan wel? Bij degene die besliste om een niet intrinsiek veilige techniek toch te gebruiken…en die wist niets van techniek…
De moraal? Kies maar: 1. als ik er maar aan verdien, de slimste verdient het er met de winst vandoor te gaan; 2. het wordt wel heel duur als je alles moet controleren; 3. het is onontkoombaar door de toenemende complexiteit; 4. het is onontkoombaar door de toename van het onverwachte/onvoorziene/oneigenlijke gebruik; 5. de mens maakt nu eenmaal fouten; 6. vul uw eigen argument in…
De oplossing is afhankelijk van de morele argumentatie…Kan ik er wat aan doen? Jawel, maar niet alleen. Wil ik er wat aan doen? Jawel, wie doet er mee?