Geen week gaat voorbij zonder nieuws van een storing die een belangrijke website offline haalt. Kort geleden trad er een storing op bij de luchtvaartmaatschappij Delta en verwijderde een werknemer van de Utrechtse start-up GitLab per ongeluk een belangrijke database. Deze datarampen zijn voorbeelden van verouderde strategieën die er niet in slagen om de benodigde veerkracht, disaster recovery en compliance naar de ict-omgeving te brengen.
In al deze gevallen was er absoluut geen sprake van een gebrek aan oplossingen voor databescherming. De ict-strategie ging echter mank onder een paar serieuze weeffouten. Ten eerste werd het herstelproces niet regelmatig getest. Ten tweede was er geen sprake van continue replicatie; er werd gebruikgemaakt van back-ups die 6 tot 24 uur oud waren. Daarmee gingen er zelfs bij een succesvolle herstelprocedure gegevens verloren. En ten slotte hadden deze organisaties hun data maar op één plek staan. Zorg er dus voor dat je je data bij verschillende leveranciers onderbrengt.
Of cio’s nu voor het eerst een disaster recovery-strategie ontwikkelen of een bestaande strategie herzien, inmiddels hebben ze wel oog gekregen voor het belang van een veerkrachtige ict-omgeving. Dit maakt het mogelijk om door te blijven werken als er een of andere calamiteit optreedt, of die nu het gevolg is van menselijke fouten, activiteiten van cybercriminelen zoals ransomware-aanvallen of een natuurramp. De realiteit is dat GitLabs, Code Spaces, grote luchtvaartmaatschappijen en tal van andere organisaties te veel vertrouwen hebben in wat zij als veerkrachtige ict zien, terwijl ze in werkelijkheid onvoldoende hebben geïnvesteerd in de planning en voorbereiding van disaster recovery. Dit brengt hen in een bijzonder gevaarlijke situatie zodra er zich dit soort incidenten voordoen. Cio’s kunnen lessen trekken uit deze goed gedocumenteerde ict-fiasco’s en op basis daarvan een solide en effectief disaster recovery-plan ontwikkelen dat (daad)werkelijk herstel mogelijk maakt.
Testen, testen en nog eens testen
Virtualisatie en innovatieve cloud-oplossingen hebben disaster recovery bijzonder eenvoudig en een stuk betaalbaarder gemaakt. Maar daar stopt het echter niet. Organisaties moeten hun disaster recovery-plannen regelmatig en consistent testen, anders kan een succesvolle uitvoering van de disaster recovery-strategie niet worden gegarandeerd.
De FBI publiceerde om dezelfde reden een bulletin genaamd ‘Ransomware Prevention and Response for CISOs’. Deze riep organisaties op tot het ‘verifiëren van de integriteit van back-ups en het testen van het herstelproces om er zeker van te zijn dat alles werkt’. Een disaster recovery-strategie moet de mogelijkheid bieden om bedrijfskritische data snel en zo volledig mogelijk te herstellen met behulp van de juiste tools en processen. Maar alvorens ict-beheerders een live fail-overprocedure uitvoeren binnen een productieomgeving, moeten ze een testprocedure uitvoeren om zich ervan te verzekeren dat de toegang tot de data behouden blijft en om mogelijke problemen te signaleren voordat ze de productieomgeving uit de lucht halen. Het kan ook nuttig zijn om een live fail-overprocedure uit te voeren op testservers of in een testomgeving om voldoende grip op het proces te krijgen.
Op dit punt aangekomen is de disaster recovery-locatie in feite een afzonderlijke kopie van je live productieomgeving binnen een ‘sandbox’-testnetwerk. Dit voorkomt communicatie met het publieke netwerk en je productieomgeving.
Hoewel er in principe niets mis is met traditionele back-up-oplossingen, nemen bedrijven er tegenwoordig niet langer genoegen mee om hun processen te herstellen naar de staat waarin ze gisteren verkeerden. Dit kan resulteren in fors omzetverlies. Daarnaast is het van cruciaal belang om een rigoureuze strategie voor bedrijfscontinuïteit en disaster recovery te hanteren die voor het herstel van data niet afhankelijk is van de kennis van individuele medewerkers. Deze strategie moet voor flexibiliteit zorgen door ondersteuning te bieden aan uiteenlopende virtualisatie-, hardware- en cloud-platforms. Verder moet de strategie effectief worden getest. Om voor werkelijk veerkrachtige ict te zorgen, moet de cio daarnaast technologie voor geautomatiseerde fail-over en gegevensherstel inzetten die gegevensverlies tot een minimum beperkt. Als de eerder genoemde bedrijven gebruik hadden gemaakt van niet-verstorende disaster recovery-tests, zouden zij in staat zijn geweest om een generale repetitie uit te voeren om de gereedheid van hun disaster recovery-processen te testen.
Back-up is geen disaster recovery
Sommige bedrijven denken dat de eenvoudigste manier om data in een gevirtualiseerde omgeving te beschermen is om back-ups te maken van virtuele machines met behulp van snapshot-technologie of agents. Deze aanpak kan er echter voor zorgen dat de productieomgeving trager gaat presteren, en is lastig om op te schalen
De meest effectieve benadering van bedrijfscontinuïteit/disaster recovery is om gebruik te maken van continue, hypervisorgebaseerde replicatie. Bedrijven kunnen hun data op deze manier voor de lange termijn opslaan met behulp van hun disaster recovery-oplossingen. Dit kan bepaalde back-up-oplossingen overbodig maken. Veel disaster recovery-oplossingen bieden namelijk back-up-achtige functionaliteit, zoals de mogelijkheid om één bestand te herstellen tot een paar seconden geleden in plaats van ettelijke uren. Dit resulteert in een fijnmaziger proces dan traditionele back-up-oplossingen.
Herstel op het niveau van individuele bestanden en point-in-time herstelpunten zouden GitLab in staat hebben gesteld om zijn database een stuk sneller te herstellen. Als het mogelijk is om gegevens te herstellen tot seconden voordat ze per ongeluk werden verwijderd, tot dertig dagen terug in de tijd, zoujeu dan genoegen nemen met een twaalf uur oude back-up? Of een nog oudere als je pech hebt?
Hybride cloud als vangnet
Cio’s zouden moeten overwegen om hun strategie te baseren op een hybride cloud die in noodsituaties een nieuwe uitwijklocatie biedt. Steeds meer bedrijven beginnen te beseffen dat het opslaan van alle data op locatie of bij slechts één cloud provider een stuk minder effectief is dan het hanteren van een hybride, of op meerdere clouds gebaseerde aanpak die door de juiste partners wordt ondersteund. Dit kan tegenwoordig uiterst eenvoudig en betaalbaar worden gerealiseerd en vormt een perfecte gelegenheid om op de cloud over te stappen. Tot nu toe weerhield het vooruitzicht van complexiteit en hoge kosten veel ict-afdelingen om een beroep op de cloud te doen. Deze nadelen verdwijnen nu als sneeuw voor de zon.
Ict-teams die in de cloud werken, merken dat ze in staat zijn om te anticiperen op problemen en hun applicaties te verplaatsen voordat het noodlot toeslaat. Een dergelijk proactieve datamigratie is niet mogelijk met een traditioneel datacenter, maar voor organisaties die een gevirtualiseerde, voor de cloud geschikte ict-omgeving omarmen is dit een realiteit. In het geval van een hack of onverwachte storing kunnen zij binnen een paar minuten reageren. Als er geen sprake is van infrastructurele afhankelijkheden, die een eenvoudige verplaatsing van gegevens in de weg zitten, kan de data van kritische bedrijfsapplicaties veilig worden ondergebracht in, en verplaatst worden tussen omgevingen op locatie en in de cloud.
Wat GitLab en de luchtvaartmaatschappij verloren, varieerde van obscure metadata tot bedrijfskritische databases. Hoewel de meningen over het relatieve belang van het gegevensverlies kunnen verschillen, staat het buiten kijf dat organisaties hun ict-strategie opnieuw onder de loep moeten nemen. Dit is immers de pijler van hun bedrijfsvoering. Elke datacenter-storing of andere ict-ramp die het nieuws haalt, bezorgt cio’s en ict-professionals in alle delen van de wereld koude rillingen. De ict-sector kan het zich niet permitteren om vast te houden aan handmatige processen en legacy back-up-procedures. Op het beste hopen is geen strategie. De sleutel tot ononderbroken bedrijfsprocessen is om flexibiliteit en toegankelijkheid te brengen naar de data en applicaties waarvan de hele branche afhankelijk is. Een sterkere focus op technologie voor bedrijfscontinuïteit en disaster recovery die cloud-infrastructuren gebruikt en grondig test zal bijdragen aan een veilige, winstgevende en betrouwbare ict-sector.