Promovendus Michal Szymaniak verbeterde de latency van grootschalige internetdiensten. Google profiteert van zijn onderzoeksresultaten op het gebied van replicaservers.
De kersverse doctor in de informatica Michal Szymaniak blijft niet plakken aan de Vrije Universiteit in Amsterdam, waar hij onlangs promoveerde: "Ik keer terug naar Google om mijn onderzoeksresultaten te incorporeren in hun globale server infrastructuur – de opdracht waar ik tijdens mijn zomerstage bij Google in 2005 aan begon."
De Poolse wetenschapper ontwikkelde een aantal methoden om internetdiensten te versnellen. Een bekende communicatietruc om de latency binnen een netwerk te bekorten is het repliceren van bestanden. In plaats van computerbestanden op één centrale plek te zetten, worden er kopieën van de bestanden geplaatst op verschillende plekken in het web, op zogenaamde replicaservers. Wanneer de gebruiker van de dienst een bestand opvraagt, verwijst het systeem naar een kopie op een nabijgelegen replicaserver. De computer van de gebruiker neemt dan contact op met die server en haalt het bestand daar op. Om de prestaties hoog te houden moet het systeem de vertraging tussen gebruiker en replicaserver inschatten. Aan de hand van deze informatie neemt het systeem beslissingen over het creëren van kopieën van bestanden op de replicaservers. Szymaniak presenteert in zijn proefschrift een aantal beslissingstechnieken die hiervoor bij grote systemen nodig zijn.
Door de methode te verbeteren, waarmee de latency tussen verschillende internetknopen kan worden gemodelleerd, kon Szymaniak beter aangeven waar replicabestanden in een netwerk geplaatst moeten worden. Om de betrouwbaarheid van replicaservers te verhogen stelt Szymaniak bovendien voor om een aantal verschillende replicaservers in dezelfde regio te reorganiseren tot één gedistribueerde server. Zo'n server is betrouwbaarder en kan meer bandbreedte bieden via het samenvoegen van de netwerkverbindingscapaciteiten van individuele replicaservers.
Video-on-demand, gaming en mobiele netwerken
Het onderzoek van Szymaniak richt zich op het internet, maar zijn bevindingen zijn ook bruikbaar voor andere grootschalige gespreide systemen. Szymaniak: "Ik denk dat de technieken die in mijn thesis worden gepresenteerd generiek genoeg zijn om toegepast te worden in verschillende soorten gedistribueerde systemen." Szymaniak noemt een paar latency-gevoelige applicaties: "Video-on-demand systemen in kabeltelevisienetwerken zouden een vergelijkbaar concept kunnen benutten om het bestellen van films prettiger te maken voor hun leden. Hetzelfde geldt voor gamingnetwerken, waarin snelle client-server communicatie essentieel is voor de eerlijke kansen van spelers en wachttijden over leven en dood beslissen. Je kunt ook denken aan het leveren van multimedia-inhoud over mobiele netwerken, vooral nu meer en meer mobiele telefoons data met zeer hoge snelheid kunnen versturen en ontvangen. Op de lange termijn zullen dergelijke netwerken op dezelfde problemen stuiten als tradionele ‘draad'-netwerken en dus op dezelfde manier kunnen profiteren van vergelijkbare oplossingen."
Nou….dat is niet echt top nieuws hoor.
Zoiets bestaat al lange tijd….het heet ISA-server…(microsoft product).
Cached diverse zaken, zoals pagina’s, inhoud, muziek. Ook met icm dfs (distributed file system) en load-balancing kun je dit realiseren. Niet zo heel veel nieuws dus…
Cisco routers hebben content management systemen die te samen met dit en andere producten perfect werken.
Dat het nu ineens zo in de media komt, is eigenlijk alleen leuk voor zijn eigen boterham.
Dit is een voorbeeld van gewenste redundantie in een gedistribueerd systeem. Op het artikel “Datastortvloed lastig in te dammen” ( zie URL https://www.computable.nl/nieuws.jsp?id=1899635 ), heb ik gesteld dat er gewenste en ongewenste redundantie bij ICT-Systemen is.
Deze replicatie versneld de toegangstijd en verbeterd de beschikaabheid van de Informatie en is daarmee dus een voorbeeld van gewenste replicatie in een gedistribueerd systeem. Bij betrouwbare ICT-Systemen wordt als randvoorwaarde gesteld dat er minstens 3 onafhankelijke opslagpunten en toegangskanalen voor deze data moeten zijn.
Deze onafhankelijke opslagpunten en toegangskanelen kunnen overigens ook gebruikt worden voor gedsitribueerde beveiligde opslag en verwerking van de gegevens.
Een voorbeeld hoe dit in het FreeMove Quantum Exchange Proof-of-Concept Systeem (zie http://docs.google.com/Doc?id=dds86766_0drrp6t ) geplementeerd is, is te vinden op de URL http://docs.google.com/Doc?id=dds86766_6hcspm2