In de filmwereld is het concept 'realtime' duidelijk gedefinieerd: 24 frames per seconde zorgen ervoor dat het menselijk oog gelooft dat beelden op een scherm vloeiend worden afgespeeld. De telecomwereld heeft een vergelijkbare benchmark ontwikkeld voor de tijd die een netwerk nodig heeft om te herstellen van een storing, zonder dat het opvalt.
Dit heet de ‘carrier class’-prestatie: vijftig milliseconden voor hoogwaardige applicaties en minder dan driehonderd milliseconden voor andere datagerelateerde applicaties. Voor tal van netwerkapplicaties, zoals financiële transacties of realtime videotransfer, waarbij het verlies van data serieuze (financiële) consequenties kan hebben, blijft de vijftig milliseconden benchmark een belangrijke grens bij het beoordelen van netwerkprestaties.
Ringtopologie
Om deze benchmark te behalen maken veel netwerken gebruik van ‘ringtopologie’. Dit is de meest gangbare methode voor de uitbreiding van optische netwerken waarbij twee punten op een ringnetwerk met elkaar worden verbonden door twee alternatieve routes. In het geval van een storing in het hoofdnetwerk kan traffic naadloos worden omgeleid.
Voor netwerken in met name grootstedelijke gebieden, blijft ringtopologie een effectieve techniek om de vijftig milliseconden benchmark te halen. Deze één-plus-één-architectuur kan echter maar één storing tegelijk aan, terwijl de kans op simultane storingen bij netwerken over langere afstanden groter wordt. Daarbij komt dat de één-plus-één-architectuur netwerkproviders dwingt om een flink gedeelte van hun netwerk ongebruikt apart te houden als verzekering bij een mogelijke storing.
Latency aware routing
Omdat veel ondernemingen wereldwijd en 24/7 opereren, rekent de bedrijfswereld steeds meer op internationale netwerken die kantoren op een veilige manier met elkaar verbinden. Grote financiële organisaties zijn dag en nacht aan het werk. Zij zijn afhankelijk van veilige en betrouwbare wereldwijde telecommunicatie-infrastructuren voor het uitvoeren van miljoenen transacties per dag in wereldmarkten. Bovendien kan latency voor financiële instituten die handelen kritiek zijn. Latency aware routing zorgt ervoor dat tijdgevoelige applicaties door het netwerk worden geleid met zo min mogelijk latency. Dit geeft financiële organisaties een significant voordeel, aangezien de kleinste vertraging van een dienst omzetverlies kan opleveren.
Het groeiende gebruik van clouddiensten door zowel serviceproviders als bedrijven zorgt ervoor dat datacentra, die vaak geografisch verspreid zijn, continu op afstand toegankelijk moeten zijn voor gebruikers om bepaalde taken uit te voeren of specifieke diensten aan te bieden. Als gevolg hiervan spelen wereldwijde optische netwerken een kritische rol bij het voortbestaan, succes en de concurrentie van internationale bedrijven en hun eindgebruikers.
Rampen en mesh-netwerken
In het geval van grote rampen, zoals de tsunami in Japan in 2011, kan ringtopologie de storingen op het netwerk niet meer opvangen. Daarom wordt steeds vaker gebruik gemaakt van intelligente ‘mesh’-netwerken en een optisch ‘control plane’: de volgende generatie van sneller-dan-realtime netwerken die meervoudig netwerkfalen kunnen overleven. In Japan zorgde deze technologie (waar toegepast) ervoor dat klanten helemaal niets merkten van alle storingen. Net als bij het kijken van een film. Goed ontworpen meshnetwerken hebben een beschikbaarheid van 99.9999 procent, wat neerkomt op slechts 31 seconden downtime per jaar. Dat is een tienvoudige verbetering ten opzichte van de traditionele op ringtopologie gebaseerde netwerken.
Nu al hebben netwerken die gebruik maken van technologieën zoals intelligente mesh en control plane of latency aware routing een concrete impact op de succesvolle wereldwijde informatiestroom en hun betekenis zal zeker groeien in de komende jaren. De prestaties van deze netwerken – en dan met name hun veerkracht en herstelvermogen – maken het mogelijk om de technologische uitdagingen, zoals netwerk downtime, aan te pakken voordat het uitdagingen worden voor bedrijven (bvijvoorbeeld problemen bij het uitvoeren van een transactie). Vanuit het perspectief van de eindgebruiker functioneren deze netwerken werkelijk sneller dan realtime.
Rob, interessant verhaal.
Maar zelden realtime performance in netwerken tegen gekomen (eigenlijk alleen maar als een point to point ethernet verbinding wat dus eigenlijk geen netwerk is).
Ben wel benieuwd hoe die performance gehandhaafd en gemonitord wordt.
Op zich waar, maar de bovenliggende protocollen gaan met dit soort tijden ook van invloed worden op de netwerkperformance. Hot swappable apparatuur en realtime omleidingen, voedingsstructuur etc etc etc hebben ook zo hun invloeden op de downtime. Maar zeker mesh structuren zijn interessant, niet alleen in de genoemde structuur, maar ook voor de bouw van Wi-Fi netwerken…..
Ach de meeste netwerk based systemen die realtime noemt, hebben helemaal niets met realtime te maken.
Wanneer ik online een vakantie boek, en de telefonische helpdesk heeft deze informatie direct bij de hand, dan zegt dat wellicht iets over de database performance maar heeft dat weinig met realtime te maken.
Bij die dingen is dat idd een heel ander verhaal, Vandaar eigenlijk ook mijn vraag,
@Pascal
Om te handelen op de beurs voor grote brokers is het wel “praktisch”, ook dat je er 50 msec eerder bent dan je buurman met een opdracht… Het zijn wel de klanten die er veel geld voor overhebben, kan ik je uit ervaring zeggen.
@Pascal
High performance is mogelijk dankzij de beste combinatie van detectie en actie. De apparatuur die het dichtst bij de storing staat kan deze normaal gesproken binnen 10 ms detecteren (bijvoorbeeld door optisch verlies van signaal). De ‘software control plane’ stuurt dan automatisch al het getroffen verkeer via een andere route. Als de alternatieve routes voor deze diensten vooraf gedefinieerd zijn (d.w.z. 1 + 1 bescherming) dan duurt zo’n omleiding maximaal 50 ms. Wanneer de nieuwe route nog berekend moeten worden duurt het in de meeste gevallen maximaal 300 ms. Dit is mogelijk door de ‘distributed control plane’ die ervoor zorgt dat de elementen van lokale netwerken sneller actie kunnen ondernemen dan wanneer alle beheersoftware zich op een centrale plek bevindt. Alle gebeurtenissen worden ook gerapporteerd aan het netwerkbeheersysteem om netwerk reparaties mogelijk te maken.
De Titel van dit artikel is misleidend of het woord realtime is misleidend.
Het artikel gaat over het feit dat er een benchmark is voor netwerken die in het geval van een storing binnen 50 milliseconden herstellen, dit herstellen is dan een vorm van rerouting.
Als het gaat om realtime dan heb je het meestal over een minimale vertraging die wordt toegevoegd aan het verstuurde signaal.
Het gaat hierbij niet alleen om de rerouting techniek in combinatie met detectie, maar ook om het ontwerp van het netwerk, vermaasd of ring of combinatie. 50 milliseconden is snel, maar dat hoeft voor de gebruiker zeker niet onopgemerkt te blijven. Als ik het zelf zou moeten specificeren zou ik eerder voor 10 milliseconden ipv 50 gaan…
Wat ik ook altijd interessant vind is of in de benchmark ook is meegenomen hou je weer terug kan naar de situatie van voor de verstoring en of dit dan ook binnen de 50 milliseconden kan.
Je zal zien dat sommige applicaties problemen hebben met reroute tijden van 50 milliseconden, dus het effect voor de gebruiker is altijd afhankelijk van bovenliggende applicatielagen. Zoals gezegd, de term realtime is misleidend.
Wat nog interessant is dat Rob in zijn reactie opmerkt dat de rerouting via alternatieve routes die van tevoren zijn ingesteld, er is dus geen dynamische rerouting, maar statische…lijkt mij nogal complex voor beheerders en kritiek voor het netwerk, wat nu als de voor gedefinieerde alternatieve route niet werkt, wat gebeurt er dan?
Waar kan ik deze benchmark overigens vinden?
@Willem:
Door control plane technologie te implementeren vindt het netwerk zelf een andere route. Die route hoeft niet vooraf geprogrammeerd te zijn. Ieder netwerkelement dat is verbonden met de control plane heeft inzage in de beschikbare capaciteit van het netwerk en hoe een dienst van de ene kant naar de andere kant gestuurd kan worden. Door dit mechanisme zullen de netwerkelementen een route vinden door het netwerk, zonder menselijke tussenkomst. Daarnaast kunnen klanten een hiërarchie instellen van ‘class-of-service’, die er tijdens netwerkverstopping voor zorgt dat de diensten met de hoogste prioriteit voorrang krijgen, wat ten koste kan gaan van een dienst met minder hoge prioriteit. Door middel van planning tools kunnen service providers verschillende storingsscenario’s simuleren om er zeker van te zijn dat hun netwerkdiensten hersteld worden volgens verwachting.
De 50ms benchmark is ontstaan in de “ITU’s Telecommunication Standardization Sector” (http://www.itu.int/en/ITU-T/Pages/default.aspx) en is in de praktijk de standaard geworden voor apparatuur in de telecommunicatie.