Een bekend gezegde luid: Een goede voorbereiding is het halve werk. Dat geldt ook voor het adequaat inrichten van crisismanagement (cm), business continuity management (bcm) en disaster recovery (dr) binnen organisaties. Het op de juiste manier inrichten en testen van deze drie disciplines geeft organisaties de benodigde daadkracht om grootschalige incidenten daadwerkelijk het hoofd te bieden.
Door deel één van dit tweeluik: ‘Wat is het verschil tussen cm, bcm en dr?’ weten we precies wat de disciplines crisis management (cm), business continuity management (bcm) en disaster recovery (dr) betekenen. In deel één is beschreven wat de kenmerkende eigenschappen zijn, maar vooral ook de verschillen tussen deze disciplines. In dit tweede deel wordt er ingegaan op hoe organisaties de verwarring voorbij kunnen gaan en cm, bcm en dr op de juiste manier kunnen inrichten. Dit zal ertoe leiden dat de synergie tussen de disciplines versterkt wordt en de organisatie beter dan ooit voorbereid is op een crisis situatie.
Cm, bcm en dr juist inrichten
In de huidige praktijk worden de drie disciplines nog vaak ingericht in silo’s, met andere woorden: zonder formele organisatorische relatie tussen de drie. Dit heeft ernstige gevolgen: veel organisaties zijn hierdoor niet voldoende voorbereid op een grootschalig incident. Door deze silo’s is de essentiële synergie nog niet aanwezig. Er zijn drie primaire maatregelen die een organisatie kan nemen om deze essentiële synergie te creëren.
1. Verantwoordelijkheden beleggen.
Allereerst dienen de verantwoordelijkheden voor de drie disciplines belegd te worden binnen de organisatie op het juiste niveau. Crisis management bij senior management, bcm bij de proces kant van de organisatie en dr bij de it-organisatie en/of leverancier. Daarbij is het noodzakelijk dat de verschillende partijen op de hoogte zijn van elkaar en elkaars processen. De verantwoordelijken dienen regelmatig bij elkaar te komen om te bepalen of de cm-, bcm- en DR-processen en -procedures nog steeds correct zijn en waar nodig deze bij te werken.
2. De juiste volgordelijkheid tijdens grootschalige incidenten.
Tijdens een grootschalig incident dienen de drie disciplines als een geoliede machine met elkaar samen te werken, zodat de schade tot een minimum beperkt wordt en het herstel vroegtijdig kan worden ingezet. Vooral de volgorde waarin de drie disciplines geactiveerd worden is van belang.
Crisis management speelt hierin een belangrijke initiërende en coördinerende rol. Cm reageert als eerste op een grootschalig incident. Het doel is om inzicht en controle te krijgen over de ontstane situatie. Het welzijn van mensen komt hier als eerste aan bod. Pas daarna verschuift de focus naar bcm.
De procesorganisatie moet ervoor zorgen dat de levering van kritische producten en diensten blijft doorgaan. De kritische bedrijfsprocessen die deze producten en diensten voortbrengen worden ondersteund door allerlei middelen. Denk hierbij aan mensen, gebouwen, voorraden, maar ook it-infrastructuur en -systemen.
De laatste discipline, disaster recovery. komt in actie wanneer de schade van het grootschalige incident bekend is. Waarbij de organisatie weet wat er moet gebeuren om weer terug te keren naar de situatie van voor het incident. Dr is onder andere daarom vaak de laatste discipline die geactiveerd wordt. De initiatie gebeurd veelal bij crisis management, maar het kan ook door bcm geïnitieerd worden.
3. Testen & awareness
Als er al tests plaatsvinden binnen deze drie disciplines, is dit in veel organisaties apart van elkaar. Oftewel zonder betrokkenheid of raakvlakken van de andere disciplines. Denk hierbij aan een crisis management simulatie oefening of een disaster recovery uitwijktest.
Zoals in het vorige punt beschreven is het belangrijk dat de drie disciplines samenwerken en gezamenlijk de crisis bestrijden. Acties in de ene discipline, kunnen grote gevolgen hebben voor een andere. Een goede samenwerking zal als gevolg hebben dat een crisis sneller en effectiever opgelost wordt. Dit kan getest worden door het uitvoeren van end-to-end tests. Hiermee wordt gedoeld op tests die zowel de cm-, bcm- als dr-disciplines betrekken.
Voorbeeldscenario
Een goed voorbeeldscenario voor een end-to-end test betreft een overstroming van een data center. Stel dat er alleen een dreiging van overstroming is, dan zal dit in eerste instantie alleen crisis management activeren. Zij onderzoekt welke maatregelen geïnitieerd moeten worden om een overstroming te voorkomen en/of de effecten ervan te reduceren. Dit doet zij voor, tijdens en na een dergelijk incident.
Stel dat vervolgens de overstroming daadwerkelijk plaatsvindt. De discipline crisis management is dan al actief vanwege de eerdere dreiging van overstroming. Nu zal zij echter diverse acties moeten coördineren op het gebied van welzijn van mensen, communicatie, herstelmaatregelen, enzovoorts. In dit scenario wordt dan ook bcm geactiveerd, omdat de dienstverlening mogelijk in gevaar komt. De juiste processen en procedures zullen getest worden om de dienstverlening te kunnen blijven leveren. Als laatste zal er – tijdens of na de overstroming – hersteld moeten worden naar de situatie van voor de overstroming. Bijvoorbeeld in de vorm van een uitwijktest naar een ander data center.
Alleen bij de uitvoering van dergelijke, realistische simulaties, met inbegrip van alle drie de disciplines, verkrijgen organisaties meer zekerheid over de staat van hun resilience.
Diederik Hammer & Jurgen Schot, experts it-security, risk & compliance
Wanneer je het feit zou durven overwegen, aannemen, dat digitaal automatiseren een zaak van exact, dus honderd procent voorspelbaar is, weet dat zaken zoals IT crisis management en disaster recovery, eveneens zaken zijn die goed doordacht in een helder proces moet worden vervat. Mennig IT diensten leverancier heeft dit soort zaken vrijwel niet in huis, zij het uiteraard op papier natuurlijk weer wel. Men gaat er domweg niet van uit dat er zoiets kan gebeuren als een crisis situatie of een situatie waar disaster recovery plaats moet nemen. Natuurlijk niet. Alled in de hand. Kijken we naar een verleden dan hebben wij het over de volkomen misser van KPN vs die ene ‘hacker’ waarbij meer dan 3 miljoen mailboxen werde down gebarcht, zonder dat ooit eens realtime te hebben getrained of gesimuleerd. Of dan hebben wij het over die ene grote brand van Vodafone in Rotterdam waar niet eens een sprinkler bleek te zijn aangebracht. Disasters zijn te voorkomen wanneer men a: wil begrijpen wat digitaal automatiseren is en b: oog heeft voor de stappen bij een eventuele eventualiteit. En van beiden weten we dat in IT land er heel weinig mensen zijn met oog voor juist deze twee zaken. Op naar het volgende grootschalige incident.