De term ‘redundant’ wordt in de it en vooral in datacenterland veelvuldig gebruikt. In de Nederlandse taal staat redundant voor ‘overbodig’ of ‘meer dan strikt noodzakelijk’. In de it heeft het woord vaak een andere betekenis. Hier wordt redundantie doorgaans als positief gezien, en wordt met redundantie bedoeld dat bepaalde voorzieningen meervoudig zijn uitgevoerd. En daar schuilt meteen het probleem.
De term redundant vliegt je om de oren, er is geen datacenter te vinden waar de infrastructuur (naar eigen zeggen) niet redundant is uitgevoerd. Omdat redundant wordt gebruikt als synoniem voor meervoudig, betekent het woord op zich niet zoveel. Wat dubbel is uitgevoerd, is minder betrouwbaar dan iets wat twee keer dubbel is uitgevoerd, maar het is allebei redundant. En dus is de ene redundantie beter dan de andere. Bovendien, je kunt een netwerkverbinding dubbel uitvoeren over hetzelfde pad, of over gescheiden paden. Het is allebei dubbel en redundant, maar ook hier is er een belangrijk verschil qua betrouwbaarheid. Tot slot, een primaire voorziening (bijvoorbeeld een netwerkverbinding van een PoP-locatie naar een datacenter) kan een capaciteit hebben van 10 Gbps, terwijl de secundaire verbinding een snelheid heeft van 1 Gbps. Je zou hier kunnen spreken van redundantie, terwijl een tweede verbinding van 10 Gbps beter is.
N+1, 2N of 2N+1
U begrijpt, N+1, 2N of 2N+1, overal is, in meer of mindere mate, sprake van redundantie. Daarom is het belangrijk om verder te kijken dan enkel naar de specificaties van bijvoorbeeld de stroomvoorzieningen, de netwerkvoorzieningen en koeling. Immers, ieder professioneel datacenter beschikt over een ups- systeem en een noodstroomaggregaat (NSA). Maar blijft het bij één in totaal? Of heeft iedere voeding eigen noodstroomvoorzieningen? En over bijvoorbeeld het aantal transformatoren wordt nauwelijks gesproken. Maar komen de voedingen van dezelfde transformator, dan heb je nog steeds een single-point-of-failure (spof). Bovendien, wat gebeurt er tijdens onderhoud? Ontstaat er dan een tijdelijke spof, of is redundantie tijdens onderhoud gewaarborgd? Daarom zou ik iedereen adviseren om te allen tijde de datacenters die men in overweging heeft te bezoeken. Laat je goed informeren en adviseren, en wees kritisch over een vage term als ‘redundantie'. Stel uzelf altijd een aantal vragen en breng de datacenterinfrastructuur duidelijk in kaart. Waar zitten de zwakke punten en hoe groot is de bedreiging voor mij?
Redundantie op 5 vlakken
De vragen die u uzelf zou moeten stellen zijn in ieder geval:
1. Wat is de redundantie in aantal?
Zijn belangrijkrijke voorzieningen meervoudig uitgevoerd? En in welke aantallen?
2. Is er redundantie tijdens onderhoud?
Verwant met punt 1. Kan redundant gewaarborgd worden tijdens onderhoud.
3. Wat is de redundantie in capaciteit?
Wat is de capaciteit van secundaire voorzieningen? Oftewel, wordt terugval voorkomen als primaire voorzieningen wegvallen? (hebben de back-up voorzieningen dezelfde capaciteit als primaire voorzieningen)
4. Wat is redundantie geografisch gewaarborgd?
Zijn voorzieningen voldoende fysiek gescheiden?
Bijvoorbeeld fibers naar en in het datacenter.
5. Is er redundantie in netwerkleveranciers?
Is het datacenter op voldoende verschillende carriers aangesloten?
Het woord redundantie is te vaag om conclusies aan te verbinden. Dit klinkt als een open deur, maar in de praktijk kijkt men niet altijd verder dan de spreekwoordelijke neus lang is.
Conclusie
Hoewel ieder datacenter in meer of mindere mate redundant is uitgevoerd, zijn er grote verschillen. Je bent niet op zoek naar redundantie, maar naar beschikbaarheid. Natuurlijk wordt beschikbaarheid ook bepaald door zaken als personeel, onderhoud aan de infrastructuur, compartimentering en afhankelijkheden van leveranciers. Maar beschikbaarheid wordt in grote mate bepaald door redundantie. Het is daarom van groot belang om precies te weten wat de gespecificeerde redundantie inhoudt. Probeer het datacenterontwerp boven water te krijgen en vergelijk dit met bijvoorbeeld de TIER classificatie criteria van het Uptime Institute. Alleen dan krijgt u echt inzicht in de betrouwbaarheid van een datacenter en kunt u datacenters met elkaar vergelijken. Pas dan kunt u de keuze maken waarvan u zeker weet dat het de juiste is. Want beoordelen welke redundantie voor uw organisatie vereist is, kunt u het beste zelf.
Rick,
Redundantie is en blijft een lastig onderwerp. Zeker in de dataceter wereld zitten er grote verschillen in. Het is daarom ook erg lastig om appels met appels te vergelijken.
Maar het is veel belangrijker om vooraf je af te vragen wat je echt nodig hebt als klant/organisatie zijnde. Wat zijn de consenquenties als je het op bepaalde lagen niet doet? Wat zijn de (financiele) gevolgen van een eventuele escalatie als iets niet redundant uitgevoerd is? Heb je dit niet duidelijk, dan in de kans erg groot dat je in een zeer tijdrovende discussie met de desbetreffende leveranciers terecht komt.
Redundantie stopt natuurlijk ook niet bij alleen bij de techniek. De menselijke factor is nog steeds een belangrijke schakel. Ook kennis en kunde dient redundant aanwezig te zijn. En dat laatste wordt helaas nog te vaak vergeten.
redundant kan beter vertaald worden door:
>- spareparts on site intelligent opgeslagen.
daarnaast, een communicatieinfarstructuur is tegenwoordig goed “redundant” te ontwerpen en in te richten, ook zodanig dat defecte onderdelen “hot” gewisseld kunnen worden.
Ik heb het begrip is even opgezocht en dat geeft veel verheldering, althans bij mij:
Redundantie (Latijn: redundare, overstromen) is het meer dan benodigd (in overvloed) voorkomen van iets. Zo kan een apparaat zijn uitgevoerd met meervoudig aanwezige onderdelen, zodat het geheel goed blijft functioneren wanneer één of meer onderdelen defect raken of verloren gaan.
Dus in de definitie van een redundant datacenter kan je stellen dat bij uitval van de meervoudig uitgevoerde componenten dit datacenter blijft werken.
Nu is het vrij dom om redundantie te eisen (tenzij je genoeg geld hebt), het gaat er veel meer om welke risico’s je kan en wil nemen. Dus je moet starten met een risico analyse en kijken wat de effecten zijn van delen van het datacenter.
Bij de risico analyse moet je vaststellen of je 1 of meerdere fouten wil kunnen overleven. Dus als ik een trafo heb en deze valt uit, dan heb ik de UPS die de eerste 30 seconden invalt en vervolgens neemt het aggregaat het over. Het aggregaat kan een beperkte tijd (meestal 24 uur) werken, afhankelijk van de brandstoftank, dus zul je bijvullen moeten regelen of andere zaken. Het komt zelden voor (zelden is minder dan 1 keer per 10 jaar) dat de stroomvoorziening in Nederland meer dan 24 uur uitvalt, de laatste keer was in de betuwe met die helikopter. Een trafo is in 24 uur te herstellen door een externe container.
Ik heb laatst gelezen dat er in Nederland 12 miljard aan onnodige risico bestrijding (en dus ook redundantie) wordt uitgegeven. Een datacenter boven Tier-3 komt in Nederland niet voor, misschien nog wel bij defensie, maar dan weten we dit niet.
Laat vooral niet te veel redundantie aansmeren, N+1, op alle cruciale componenten is meestal voldoende, zeker als je 2 datacenters hebt. Een beetje netwerk architect beveelt al 25 jaar geografische gescheiden netwerkpaden aan en het is juist verstandig om andere technologie als redundant te beschouwen. Dus als de telefooncentrale uitvalt, mobiel bellen, dat is ook een vorm van redundantie.
Denk ook aan de voordelen van cloud computing. CC is meestal gebaseerd op meerdere datacenters, je hoeft dan eigenlijk zelf niets meer redundant te maken, behalve het netwerk. in geval het netwerk uitvalt stuur je iedereen naar huis, ervan uitgaande dat je met een downloadbare client of internet connectie thuis kunt werken. Alles is relatief.
Ruud,
Uiteraard begint alles met het in kaart brengen van risico’s en interne eisen, bijvoorbeeld met een business impact analyse. Vandaar ook mijn afsluiting dat gebruikers zelf het beste kunnen bepalen wat ze nodig hebben. Ik kan adviseren, en mijn eerste advies is een gedegen voorbereiding.
Uiteraard is de menselijke factor erg belangrijk, human errors veroorzaken het meeste downtime. In dit artikel wilde ik me echter richten op de infrastructuur van het datacenter omdat ik merk dat hier soms te weinig aandacht aan besteed wordt. Zeker bij cloud computing hoor ik hier zelden iets over, bijvoorbeeld omdat veel aanbieders niet over een eigen datacenter beschikken.
@ Willem: je stelling dat redundantie eisen vrij dom is vind ik wat erg ongenuanceerd. Ter illustratie, je voorbeeld m.b.t. stroom vind ik ook niet zo sterk, er zijn meerdere storingen bij Nederlandse DC’s geweest waarbij de noodstroomaggregaat faalde. Ondanks het iedere maand testen. Bovendien loop je grotere risico’s bij onderhoud.
IT is onmisbaar, maar downtime heeft ook steeds grotere nadelen, denk maar aan de maatschappelijke en politieke verontwaardiging bij recente storingen bij de spoorwegen en in de telefoniewereld.
In je laatste opmerking geef je aan dat cloud computing meestal gebaseerd is op meerdere datacenters. Kun je dat onderbouwen? Ik heb de indruk dat bij private cloud en shared cloud oplossingen dit doorgaans niet aan de orde is. Het komt meer op door hybrid cloud oplossingen en mogelijkheden van bijvoorbeeld vCloud Director, maar ik heb nog niet de indruk dat dit al zo ingeburgerd is als jij nu stelt.
Ik ben het met je eens dat je een risico-analyse moet uitvoeren, de spreekwoordelijke bakker op de hoek hoeft geen TIER3 datacenter in te zetten.