De man die miljarden had kunnen verdienen met zijn uitvinding, maar een baan als ambtenaar verkoos, was in mei enkele dagen in Nederland voor een vergadering van het World Wide Web Consortium (W3C). De uitvinder en evangelist van het Web, Tim Berners-Lee, pleit voor een Web dat voor iedereen zo transparant mogelijk is én blijft.
Interviews geeft hij nauwelijks en als directeur van het (neutrale) World Wide Web Consortium (W3C), is hij zéker niet van plan om te reageren op de antitrustzaak tegen Microsoft. Toch heeft hij daarover een interessante visie gegeven in zijn persoonlijke geschiedenis De wereld van het World Wide Web. Hij is een uitgesproken voorstander van en vechter voor neutraliteit op het Web.
De strijd tussen Netscape en Microsoft om de browser-markt komt uitgebreid aan bod in zijn boek. Hij stelt daarin dat wat hem betreft het Web uit drie lagen bestaat: de inhoud (content), het netwerk als medium en de software met de hardware. Hij schrijft dat er niet zoveel bezwaar zou zijn tegen het feit dat een bedrijf één van deze lagen beheerst, zo lang het er maar niet twee of meer zijn. Want dan heeft zo’n bedrijf te veel invloed op wat gebruikers wel en niet kunnen zien of vinden op het Web. Het is onweerlegbaar dat Microsoft (of Gates) zich ook inkoopt in het medium: WebTV, kabelbedrijven en noem maar op.
De geruchten circuleren dat hun nieuwe strategie volledig op het Web gericht is. Wat vindt u daarvan?
Tim Berners-Lee: "Toch kan een monopolie in een enkele laag al innovatie verhinderen en de prijs opdrijven, wat zeker niet wenselijk is. Wat betreft de derde laag, er is voldoende concurrentie op het gebied van hardware, dus daar ontstaan geen problemen. Helaas komt de software meestal vooraf geïnstalleerd mee. En ook al is de browser maar een klein deel van die software, mensen zullen noch de browser, noch de andere software snel vervangen. Het gevolg kennen we." Hierover later meer.
Maar is de verticale integratie erger?
Berners-Lee: "Inderdaad. Als een bedrijf de toegang tot het Web beheerst, bijvoorbeeld omdat de combinatie van browser en server bepaalde sites bevoordeelt, wordt de inhoud van het Web gefilterd. Dan krijg je alleen bepaalde informatie te zien, en daar ben ik op tegen. Als Engelsman ben ik opgegroeid met de neutraliteit van de BBC, die ik erg op prijs stel. Helaas zijn er op het Web heel veel mogelijkheden tot manipulatie, zonder dat de gebruiker dit merkt."
Hij legt uit dat deze zaak niet eenvoudig ligt. Middels aantrekkelijke portalen, worden klanten naar bepaalde sites gelokt door eenvoudig op bepaalde knoppen te klikken. De service provider kan het bezoek – tegen betaling – verder aantrekkelijk maken door een snellere verbinding te leveren dan voor andere sites. Met als gevolg dat gebruikers straks niet meer beseffen wat voor variëteit aan informatie op het Web beschikbaar is. Je kunt bedrijven namelijk niet verbieden te betalen voor de knop in het portaal of voor een betere verbinding. Desondanks pleit Berners-Lee voor een web dat voor iedereen zo transparant mogelijk is en blijft.
Exponentiële groei
Bill Joy van Sun stelde onlangs in Computable dat het al sinds 1995 duidelijk is dat er eigenlijk geen sprake is van een enkelvoudig web. In zijn visie zijn er zes webben mogelijk: voor surfen, voor e-handel en e-mail, voor amusement, voor mobiele apparatuur, voor spraakherkenning, voor bedrijfssystemen, en voor ingebedde systemen en sensoren. Berners-Lee: "Als ze maar aan elkaar gekoppeld zijn en als één geheel geadresseerd kunnen worden, mag iedereen van mij de verdeling maken die hij wenst. Zolang het geheel maar voor iedereen bereikbaar blijft."
Toch is de vraag van schaalbaarheid aan de orde. Als het Web exponentieel blijft groeien – een verdubbeling elke negen of tien maanden – kan dat maar door blijven gaan als één geheel?
"Waarom niet? Ik heb het idee dat we ook exponentieel meer op papier zetten, denk maar aan alle rapporten, tijdschriften en boeken die verschijnen. Dat kan toch – technisch gezien – ook blijven doorgroeien?"
Maar het is nu al moeilijk om bepaalde informatie te vinden. Straks kun je die helemaal niet meer vinden in de groeiende informatieberg!
"Die zul je dan gaan krijgen via referenties uit betrouwbare bronnen. Verwijzingen in een tijdschrift dat je vertrouwt of van een collega wiens kennis je hoog inschat. Er is een experiment geweest waarbij willekeurige personen uit de westelijke helft van de VS, steeds alleen via goede bekenden, in contact moesten komen met een bepaalde, willekeurig gekozen persoon in Massachusetts aan de Oostkust. Het bleek dat dit gemiddeld in zes stappen plaats vond. Heel opmerkelijk, naar mijn mening, voor een bevolking van meer dan 160 miljoen! Wiskundig kun je ook bewijzen dat als een maatschappij fractaal is, er zes graden afstand zit tussen iedereen. Dat geeft het belang van vertrouwde verwijzingen aan."
Hij spreekt hierbij duidelijk over een statistisch gemiddelde.
In zijn boek geeft hij ook aan dat vertrouwde verwijzingen een goed middel zouden zijn tegen fraude op het Web. Een vertrouwde publieke figuur, een vertrouwde derde partij of een goede kennis kan zo’n betrouwbare verwijzing geven.
Homogene software
‘Betrouwbare verwijzingen’ klinkt aantrekkelijk, maar in hoeverre zijn ze te realiseren?
"Voor mensen is het niet veel anders dan de manier waarop zij nu al keuzes maken. Ze vertrouwen kennissen en leveranciers en beschouwen onbekenden met enig wantrouwen, en maken bepaalde keuzes. Soms worden ze te pakken genomen en dan leren ze wat je beter niet kunt doen of juist wel moet doen. Ook hierbij is transparantie essentieel."
Berners-Lee stelt dat het niet zo mag zijn dat een computer iets doet – bijvoorbeeld een script uitvoeren – zonder dat de eigenaar gewaarschuwd wordt. Hij duidt hier duidelijk op de Lovebug die ongebreideld zijn gang kon gaan, omdat de scripting host in Windows standaard op ‘uitvoeren zonder waarschuwing’ wordt meegeleverd en niemand daarvoor wordt gewaarschuwd. Voor een deel zijn de problemen ook te wijten aan de grote homogeniteit in software, zegt hij, hetzelfde effect dat ontstaat bij inteelt: een monocultuur die kwetsbaar is omdat iedereen hetzelfde e-mailprogramma gebruikt. Er zou meer diversiteit in software moeten komen.
Wat betreft machines, er zijn veel ‘agents’ werkzaam op het Web. Niet alleen agents die ’s nachts het Web afschuimen voor het maken van indexen voor zoekmachines, maar ook om allerhande klusjes uit te voeren. Patti Maes, werkzaam bij het MIT, was een van de grote gangmakers.
Wat vindt u van agents op het Web?
"In het algemeen een hele goede zaak als het erom gaat het Web doorzichtiger en inzichtelijker te maken voor de gebruikers, maar er zijn natuurlijk ook gevaren. In W3C circuleert nu het voorstel voor een Platform for Privacy Preferences Project (P3P), waarmee een site zijn privacybeleid kan formuleren in machine-leesbare vorm. Het idee is dat gebruikers weten wat dat beleid inhoudt, voordat ze gegevens naar een site sturen. En dat ze hun agents kunnen instrueren alleen met bepaalde sites in zee te gaan."
Naijleffecten
XML (eXtensible Markup Language) is met veel gejuich ontvangen omdat het een enorme uitbreiding is van het nogal beperkte Html, oorspronkelijk gebruikt voor het Web. Hierdoor ontstaan veel nieuwe mogelijkheden, bijvoorbeeld voor multimedia-toepassingen op het Web, maar tegelijkertijd creëert het ook legacy-problemen.
Berners-Lee: "Het is heel gemakkelijk om Html om te zetten naar XML of Xhtml (de definitie van Html in XML); die conversie kan ook online gebeuren. Dus wat is het probleem? Dat je via WAP (Wireless Application Protocol) niet zo maar een Html-site kan bezoeken, alleen een XML-site? Tja, daar zullen we dan wat op moeten vinden. Omgekeerd is het in ieder geval wel mogelijk om de sites die door DoCoMo in Japan voor I-Mode (een voorloper van WAP) zijn opgezet op de conventionele manier te benaderen."
Op de vraag, hoe uitgebreid XML op dit moment wordt toegepast, komt geen duidelijk antwoord. Hij zegt met nadruk dat een mobiele telefooncentrale veel weet over het gebruikte mobieltje en daar zijn informatiestroom op instelt. Dat zou ook bij servers mogelijk moeten zijn. Berners-Lee stelt dat technologie heel lang naijlt: hij weet zeker dat 5,25 inch floppies en ponsband nog steeds gebruikt worden, hoewel iedereen denkt dat algemeen is overgeschakeld op diskettes en CD-R. Hij heeft onlangs gesproken met de beheerder van een van de eerste sites op het Web, die fraaie manuscripten van het Vaticaan toont. "Die site is natuurlijk ook nog gecodeerd met Html, en de beheerder is absoluut niet van plan om dat te veranderen."
Er zijn niet alleen legacy-problemen, vertelt Berners-Lee, maar ook andere, nu de veelbesproken convergentie van apparaten voor het Web eindelijk vorm begint te krijgen. De vraag hoe informatie op een zodanige manier opgeslagen kan worden dat zij op veel verschillende manieren gepresenteerd kan worden – niet alleen door weglaten – is een heel essentiële. Het probleem is dat je op grote schermen het geheel kunt tonen, op middelgrote schermen gebruik je een schuifbalk en op kleine schermen een invulvak, om bijvoorbeeld een telefoonnummer op te zoeken; via een ‘voice-browser’ kun je ook zonder scherm informatie opvragen en geven. Maar de vraag is natuurlijk wat je kunt doen om dat zo goed mogelijk te laten verlopen. Op de vergadering van W3C in Amsterdam is dit punt uitbundig aan de orde geweest.
Wat is belangrijk nu er steeds meer verschillende draagbare apparaten komen?
"Het gaat hierbij vooral ook om de betekenis van bepaalde informatie. Dit is een eerste keer dat we wat uitvoeriger over het semantische web gesproken hebben in W3C. Ik ben heel blij met die ontwikkeling." In zijn boek bespreekt Berners-Lee uitvoerig zijn algemene ideeën voor het semantische web, dat hij ziet als de volgende grote stap voor het Web.
Het semantische web
Bij het semantische web gaat het om betekenissen. Html en XML geven alleen aan hoe informatie weergegeven kan worden, niet wat de betekenis is van die informatie. De consequentie is dat alleen de mens die informatie kan interpreteren. Zoekmachines kunnen weliswaar de opschriften boven kolommen proberen te ontcijferen om uit te vinden wat de informatie precies betekent (productnummer, prijs, aantal of belasting), maar dit is niet betrouwbaar. Willen we machines inschakelen voor het gebruik van web-informatie, dan zal ook de betekenis van informatie moeten worden gecodeerd, net als nu de weergave. Dit is geen eenvoudige zaak omdat dit veel afspraken tussen mensen onderling vereist.
De vraag, hoe het semantische web zich zal gaan ontwikkelen, beantwoordt Berners-Lee met een wedervraag. "Hoeveel tijd heb je?! Er loopt een aantal researchprojecten op het gebied van lidmaatschappen, toegang verlenen enzovoorts, waarmee we de belangstelling proberen op te wekken. Maar het zal waarschijnlijk veel samenwerking en vele jaren kosten voordat we daadwerkelijk die richting kunnen inslaan. Wat het probleem is? Aan de ene kant is het een technisch probleem om de nodige beslissingen te nemen en de programma’s te ontwikkelen die betekenissen kunnen verwerken. Verder moeten mensen aan het idee wennen en het nut ervan inzien, voordat ze het willen gebruiken. Ten slotte zijn er nogal wat alternatieven gebaseerd op XML, waarmee gegevens in goed gedefinieerde vorm overgebracht kunnen worden, bijvoorbeeld ter vervanging van het huidige ‘electronic data interchange (gebruikt voor communicatie tussen bedrijven, HvS). Dat is zeker niet hetzelfde als mijn idee voor het algemene semantische web, maar het vermindert wel de noodzaak ervoor."
Met betekenissen op het Web, haal je waarschijnlijk nog meer mogelijkheden voor frauderen binnen.
Het is nu toch al zo dat er bedrijven zijn die je positie op de lijst van zoekmachines kunnen verbeteren door bepaalde trucjes uit te halen in de codering van de website.
"Zeker, keyword = tulip, tulip, tulip, tulip…! (De vergadering van W3C vond plaats in de bollentijd). Maar zonder gekheid, natuurlijk zal het vertrouwen dat mensen in de andere partij hebben, een sterkere rol gaan spelen. Vertrouwen en betekenis gaan samen. Ze kunnen niet zonder elkaar bestaan. Maar uiteindelijk zullen betekenissen het Web een enorme meerwaarde geven. Dit zal de nodige tijd en moeite kosten, maar het zal de moeite waard zijn."
Om te weten hoeveel moeite het Tim Berners-Lee gekost heeft om mensen te overtuigen van het nut van het huidige Web, dat nu een volledig geaccepteerde en uiterst nuttige toevoeging aan Internet – voor veel mensen zelfs hét Internet – is geworden, dan is het zeker nuttig zijn persoonlijke geschiedenis van het Web lezen. Wat ‘de nodige tijd en moeite’ betekent, wordt dan zeker duidelijker.
Aan het eind van het interview, haalt Berners-Lee een digitale camera tevoorschijn om mij en mijn visitekaartje te fotograferen. "Voor mijn web-archief, want ik heb een hekel aan tikken. Anders kan ik je straks niet meer terugvinden."
Wij mogen geen foto’s nemen van deze gedreven man en moeten het doen met een officieel plaatje van de website van W3C.
Hein van Steenis, freelance medewerker
Literatuur
Tim Berners-Lee,
De wereld van het World Wide Web,
Uitgeverij Nieuwezijds,
ISBN 90.5712.090.9