De gemeente Heerenveen was maandagochtend 31 maart niet bereikbaar. De temperatuur in de serverruimte werd, door een kapotte airconditioning, zo hoog dat de servers ermee ophielden. Zowel telefoon- als internetverkeer was niet mogelijk.
Door uitval van servers was de gemeente Heerenveen maandagochtend 31 maart niet bereikbaar voor burgers. Tot 13:00 uur lag het netwerk- en telefoonverkeer naar de gemeente plat. Ook de ambtenaren konden geen gebruikmaken van het computernetwerk.
Reden voor de uitval was een airconditioning die op hol was geslagen. De temperatuur in de serverruimte liep daardoor op naar 45 tot 50 graden. De servers hebben zich daarom vanzelf uitgeschakeld. Het probleem werd vanochtend rond acht uur geconstateerd, maar waarschijnlijk zijn de servers al eerder platgegaan.
Noodvoorzieningen
De gemeente heeft allerlei noodvoorzieningen genomen om de temperatuur in de serverruimte te laten dalen. Daarna zijn de machines weer opgestart. "Binnen een half uur was alles weer hersteld. Alles draait nu weer zoals het hoort", vertelt woordvoerder van de gemeente Jessica Derks.
De gemeente heeft een extern backupsysteem. Medewerkers waren bezig om dit backupsysteem op te starten, maar dat was niet meer nodig. Het probleem was al opgelost. De fysieke veiligheid van de serverruimte wordt onderzocht en ook de procedures bij calamiteiten zullen naar aanleiding van dit voorval weer onder de loep worden genomen. Derks noemt het voorval een ‘mooi leermoment’.
Derks noemt het voorval een ‘mooi leermoment’.
Was dat bij een echt bedrijf, bank of belastingdienst gebeurd, dan was het een schande. Tja, blijft ambtenarij.
Geloof me, dit is ook al bij de Belastingdienst gebeurd. Zelf meegemaakt.
Belachelijk dat dit pas ’s ochtends 08:00 wordt geconstateerd!
SNMP-beheersysteempje kan temperaturen, beschikbaarheid services etc monitoren, en bij calamiteit technisch medewerker in kennis stellen met bijv SMS.
In mijn opvatting gaan leermomenten, en gebruikers die niet kunnen werken NIET samen!
Ook met snmp-systemen kan het falen. Daarnaast staan airco systemen ook vaak gekoppeld aan een alarmcentrale. En dan ben je afhankelijk van de centrale die de melding moet uitgeven. Ik heb het meegemaakt dat de alarmcentrale deze melding niet doorgegeven heeft waardoor ’s ochtends bij binnenkomst dit werd gesignaleerd. Het betrof toen een landelijke omgeving die we uit hadden staan. Het heeft toen hele dag geduurd voor de systemen weer actief waren en we de schade hebben kunnen opmaken.
Ja inderdaad een enkelvoudig systeem kan falen, maar bovenstaande problemen zijn te voorkomen door meervoudige systemen toe te passen.
Allereerst kan er voor gezorgd worden dat het koelsysteem redundant uitgevoerd is. Verder kan een meervoudig alarm systeem ge?nstalleerd worden. SMS in combinatie met een meldkamer bijvoorbeeld.
Het voorkomen van dit soort problemen is meestal een combinatie van een goed computerruimte ontwerp,en het implementeren van een goede beheersstructuur. Een incident als dit legt vaak de zwakke plekken bloot, het is dan wel zaak om het probleem structureel op te lossen.