Pre-occupation with failure

Korte uitleg

Pre-occupation with failure – Hoge mate van gerichtheid op wat er mis kan gaan – stelt een HRO in staat om te anticiperen wat er mis kan gaan en vervolgens alert te blijven. Zij beheersen de kunst van gelijktijdig putten uit een groot collectief geheugen én out-of-the-box denken. HROs weten dat je nooit alles wat mis kan gaan van tevoren kunt bedenken, dat de voorbereiding fouten moet bevatten, en blijven daarom continu alert op afwijkingen van de verwachting.

Deze verhoogde alertheid en gerichtheid maakt HROs scherper dan verglijkbare organisaties. Mogelijke gevolgen van hetgeen er wordt waargenomen worden grondiger doordacht, en er worden meerdere scenario’s ontwikkeld.

Áls er iets gebeurd is dat niet tot een catastrofe heeft geleid, dan is de neiging goed om even met de handrug over het voorhoofd te vegen en met een zucht van opluchting verder te gaan. Misschien wordt zelfs een success gevierd. Er wordt dan niet het nodige ervan geleerd om in het vervolg betrouwbaar te kunnen blijven functioneren.

Niet zo bij een HRO. Een bijna-misser staat gelijk aan een misser en wordt hoog opgenomen. Dat is maar goed ook.

Voorbeeld

Een ministerie verplaatst in Den Haag een groot rekencentrum. Het gaat om een complex geheel van applicaties, servers en netwerkinfrastructuur. Om 8:00 s’morgens moet alles weer werken. De voorbereiding is in handen van de projectleider en het projectteam. Zorgvuldig gaan zij te werk, letten op de kritieke punten waarop het mis zou kunnen gaan.

Één van die punten zijn de liften in het gebouw: stel dat daar iets mee mis zou gaan. Enkele maanden voor de verhuizing wordt daarom een extra controle uitgevoerd door een extern bedrijf en onderhoud gepleegd. Een week voor de verhuizing vindt een grondige check plaats. Alles is in orde.

Het team heeft bovendien een klein team van de leverancier geregeld om tijdens de verhuizing paraat te staan. Hier zijn de principes Reluctance to Simplify en Committment to Resilience aan het werk. Het is makkelijk om na de laatste check te zeggen dat de liften dus geen probleem zullen zijn. En vervolgens niet de extra middelen beschikbaar maken voor het geval dát het alsnog mis gaat.

De leden van het standby team drinken koffie en eten worstenbroodjes…en dan gaat het onverwacht daadwerkelijk mis: een lift met meerdere servers en een systeembeheerder blijft tussen twee verdiepingen steken! Het stand-by team is direct ter plaatse en kan apparatuur en systeembeheerder bevrijden, de operatie loopt gewoon door. De verhuizing is succesvol binnen de tijd verlopen, het applicatielandschap draaide om 8:00.

Hier zou je het bij kúnnen laten: succesvolle afloop, case closed. Maar wacht even! Hoe kan het dat de lift ondanks de genomen maatregelen alsnog is blijven steken? Het was niet de bedoeling dat het stand-by team in moest grijpen. Het is net als het doorbranden van een zekering – goed dat de zekering erin zit, maar we moten toch nagaan waarom deze nodig was. HRO betekent dat dit incident zorgvuldig wordt geëvalueerd en in een productief leerproces wordt verwerkt tot hogere betrouwbaarheid in de toekomst.