De storing in het distributiesysteem van de OV-chipkaart van 9 januari 2012 is veroorzaakt door een fout in de programmacode van de software van het centrale systeem dat de ophaalautomaten aanstuurt. Dit heeft het samenwerkingsverband tussen OV-bedrijven Trans Link Systems (TLS) bekend gemaakt. In de media circuleerden berichten dat de storing volume gerelateerd was, maar dit bleek niet juist. TLS heeft het euvel inmiddels verholpen.
TLS heeft een analyse op zijn computersystemen losgelaten waaruit bleek dat ‘een combinatie van factoren' leidde tot de storing waarbij reizigers in het openbaar vervoer geen bestellingen meer konden ophalen met hun OV-chipkaart. Wat de combinatie precies inhoudt, laat woordvoerder van TLS Anita Hilhorst in het midden. Wel kan ze dus zeggen dat het om een fout in de programmacode gaat.
‘Wij hebben wijzigingen in het centrale systeem doorgevoerd, waardoor de storing zich niet meer voordoet', aldus de zegsvrouw. ‘We houden het systeem nog wel nauwlettend in de gaten om te waarborgen dat we niets over het hoofd hebben gezien. Op dit moment functioneert het systeem goed en bij eventueel afwijkend gedrag zijn voldoende maatregelen voorhanden die direct toepasbaar zijn om het systeem in de lucht te houden.'
Eigenlijk zegt dit dus niets. Bottom line is het altijd een software fout. Als het een hardware fout is, en de software gaat daarvan over de flos, dan is de software dus niet robuust genoeg gemaakt.
Interessanter is om te weten of dit scenario voorzien was, of deze combinatie getest is, en waarom dan wel of niet.
Dit soort informatie krijgen we echter zelden, waardoor anderen er niet van kunnen leren.
Helaas
Verwacht je dat dan PaVaKe? Dat soort organisaties heeft al moeite genoeg hun ‘goede naam’ hoog te houden… ze gaan echt geen tech-details geven die krijg je overigens genoeg als je kennis en ervaring combineert met hetgeen je op het internet tegen komt.
@Pascal
Nee, dat verwacht ik niet, maar op deze manier komt zo’n organisatie er wel heel makkelijk vanaf natuurlijk. Je noemt het een softwarefout en politiek Den Haag is weer tevreden.
Beste PaVaKe en Pascal,
N.a.v. jullie reacties hebben we TLS om een reactie gevraagd. Dit zeggen ze nog als aanvulling op hun eerdere reactie:
Er is wel degelijk onderscheid tussen hardwarefouten (bijv crashes van harde schijven, defect raken van moederbord, stuk gaan van geheugen etc) en softwarefouten (bijv locks in een database, codefouten etc.). Hardware fouten worden in de meeste gevallen verholpen door vervanging of reparatie van het component. Maatregelen die zijn getroffen om de impact van dergelijk hardware fouten minimaal te laten zijn, zijn redundancy in de infrastructuur of uitwijksystemen. Deze maatregelen heeft TLS getroffen. Software fouten dienen te worden opgespoord en opgelost. Eventueel kan tijdelijk een workaround worden ingezet. Door het toepassen van een OTAP strategie op alle systemen (software wordt ontwikkeld in stappen van ontwikkeling, test, acceptatie en productie) voorkomt TLS zoveel als mogelijk softwarefouten in programma’s. Het incident van 9 januari betrof een softwarefout. Overgang naar andere hardware of uitwijk is dan geen oplossing omdat daar dezelfde software in gebruik is.
Groet,
Sander Hulsman, Computable