Vier lessen uit de Crowdstrike wake-up call

De wereldwijde computerstoring, veroorzaakt door een foutieve software-update van cybersecurity-softwareleverancier Crowdstrike, veroorzaakte wereldwijd problemen. Talloze organisaties, van luchthavens en banken tot ziekenhuizen, gingen plat. Wat kunnen we er uit leren?

Eerst het technische verhaal. CrowdStrike wijt de grootschalige uitval aan een fout in de kwaliteitscontrole. Een ‘bug’ in de tool (Content Validator) waarmee het systeem-updates checkt op vergissingen, zorgde ervoor dat een kritieke fout in de software bleef zitten. Een van hun twee ‘template instances’, een reeks instructies die de software begeleidt bij het zoeken naar bedreigingen, slaagde ten onrechte voor de validatie.

De update werd daarop ongehinderd doorgestuurd naar de (eind)gebruikers en resulteerde in een Windows-systeemcrash. Volgens CrowdStrike heeft de bug wereldwijd 8,5 miljoen computers getroffen.

1. Testprocedure aanpassen

De eerste les zit in het aanpassen van de procedure. Critici vroegen zich af of niet veel meer testprocedures nodig zijn voordat dit soort software massaal wordt uitgerold, zeker bij updates die hele ecosystemen kunnen platleggen. Updates zouden eerst uitgebreid moeten worden getest in gecontroleerde omgevingen om eventuele bugs of compatibiliteitsproblemen te identificeren.

Volgens CrowdStrike is inmiddels een ‘nieuwe controle’ aan zijn kwaliteitscontrole-proces toegevoegd. Ook wil het cybersecuritybedrijf voortaan updates meer geleidelijk uitrollen.

2. Business continuity-plannen bekijken

Lessen zijn er ook te trekken voor bedrijven die last ondervonden. Organisaties moeten robuuste noodplannen hebben om snel te kunnen reageren op technische storingen. Dit omvat niet alleen de technische aspecten van herstel, maar ook communicatieprotocollen om klanten en gebruikers adequaat te informeren.

‘This wasn’t a breach of a fintech or medical operation; it was CrowdStrike, a company known for its cybersecurity expertise’, zegt een coo van een grote organisatie anoniem op een forum van Gartner. ‘If such a well-funded and knowledgeable company can experience this, it underscores the need for all business leaders to ensure they have a well-tested and well-thought-out business continuity plan.’

Bedrijven moeten, volgens hem, nog meer investeren in redundante systemen en infrastructuur om te voorkomen dat één enkele fout leidt tot algehele stilstand. Monitoringtools kunnen helpen bij het snel detecteren van afwijkingen.

3. Meer transparantie en samenwerking

Het incident benadrukt ook het belang van transparantie en samenwerking tussen softwareleveranciers en hun klanten. Dit zorgt ervoor dat alle betrokken partijen beter voorbereid zijn op mogelijke toekomstige problemen. CrowdStrike had namelijk toegang tot het ecosysteem van Microsoft en diens Windows-pc’s.

4. Juridische duidelijkheid

Als het CrowdStrike-incident ons ook iets geleerd heeft, dan is het dat bedrijven op de hoogte moeten zijn van de wettelijke verplichtingen waaraan zijzelf of hun it-dienstverleners zich moeten houden. Op dit moment zal de mogelijke aansprakelijkheid van CrowdStrike vooral worden bepaald door de concrete afspraken in de huidige contracten.

Inmiddels beginnen de rechtszaken hiervoor zich op te stapelen. Zo klaagt Delta Airlines het computerbeveiligingsbedrijf aan voor vijfhonderd miljoen dollar.

Dit artikel verscheen eerder in het Engelstalige Cybersec e-Magazine editie 6. Lees hier dit hele e-magazine: