Een van de eerste tekstverwerkers, Trendtext, draaide op een 8-bit microcomputer. Het was mijn favoriete universitaire onderzoeksproject. Nu, twintig jaar later zijn we zover dat we een Pentium-processor, 32 Mb geheugen en een eindeloze hoeveelheid diskruimte nodig hebben. De moderne tekstverwerker werkt op basis van Wysiwyg (kent u hem nog: what you see is what you get), terwijl de oorspronkelijke tekstverwerker gebruik maakte van een karaktergeoriënteerd beeldscherm van 24×80 tekens.
Wysiwyg ofwel het grafische user interface (gui) kan een groot aantal verschillende lettertypen en lettergroottes aan; de letters worden afgebeeld zoals zij op papier worden afgedrukt. Er zijn twee grote verschillen tussen de oude en de nieuwe tekstverwerkers: (a) de oude tekstverwerkers werden bediend door middel van commando’s die met behulp van control-combinaties of functietoetsen werden gegeven, die later werden vervangen door het direct manipuleren van de tekst zelf; (b) het bestand waarin de tekst wordt opgeslagen bevat nu ook informatie over lettertype, kleur, attributen en dergelijke. Rich Text Format (RTF) is een standaard voor tekstbestanden, maar elke commerciële tekstverwerker heeft zijn eigen geavanceerde formaat, dat natuurlijk afwijkt van alle andere formaten. Vroeger was dit niet zo’n probleem, omdat iedereen binnen één organisatie dezelfde tekstverwerker gebruikte. Tegenwoordig zijn nieuwe versies al niet meer compatibel met oudere versies, en via het Internet worden bestanden uitgewisseld tussen niet-compatibele tekstverwerkers. Gebruikers van e-mail zouden het invoegen van tekstbestanden (attachments) zoveel mogelijk moeten beperken en in plaats daarvan gebruik moeten maken van eenvoudige editors. Een klein beetje opvoeding, zodat mensen weten wat het verschil is tussen platte tekst en een tekstbestand, kan de opslagruimte en netwerkbelasting sterk doen afnemen.
Met de huidige tekstverwerkers is dit slechts bijzaak. Na de enorme sprong van karakters naar Wysiwyg – pioniers waren Xerox en de Apple Macintosh – is er nog maar weinig vooruitgang geboekt. Om ‘beter’ dan de concurrent te zijn, heeft elke nieuwe versie van Microsoft, Lotus, Corel en dergelijke weer meer functies dan zijn voorganger. De meeste van deze ‘features’ zijn voor de doorsnee gebruiker van nul en generlei waarde. Integendeel, de gebruiker heeft er eerder last van: (a) ze maken de software complexer; (b) grotere programma’s zijn minder betrouwbaar, en (c) ze leiden tot compatibiliteitsproblemen. Is het niet zo dat de meeste gebruikers beter af zouden zijn met een iets verbeterde versie van Microsoft Works dan met Office 97? De complexiteit van de nieuwe, ongewenste functies heeft ervoor gezorgd dat de nieuwe software contra-intuïtief is en hierdoor in strijd is met alle gui-principes.
Er is een veel groter probleem met de huidige tekstverwerkers: alle aandacht is gericht op het verbeteren van de vervanger van de typemachine. Er wordt niets gedaan om de scope van de applicaties uit te breiden.
De dominantie van Microsoft Office is zo groot, dat grote organisaties tekstverwerkers gebruiken om documenten en handleidingen te ontwikkelen. Een simpele brief is ook een document, maar een beetje document kent meerdere auteurs. Documenten hebben een relatief lange levensduur en worden door vele auteurs gewijzigd en aangevuld. Het vaste formaat van een tekstverwerkersbestand is een ramp. Bijzonder irritant zijn de problemen die optreden bij het combineren van verschillende layout-standaarden – door verschillende gebruikers, door verschillende afdelingen of bij fusies tussen bedrijven. Het is verbijsterend dat zakelijke gebruikers zich met simpele tekstverwerkers laten afschepen en niet harder klagen over het gebrek aan functies die het mogelijk maken dat meerdere auteurs aan één document kunnen werken.
Het kernprobleem is de continuïteit van de typemachine-analogie. In een tekstverwerker maakt de gebruiker tekst aan zonder rekening te houden met andere auteurs. Daarbij vermengt hij in één bestand de tekst met de layout: stijl, lettertype, lettergrootte en dergelijke. Als de layout veranderd moet worden, moet het hele document bewerkt worden. De uitgeverswereld werkt daarentegen al jaren met gestructureerde technieken , waarbij gebruik wordt gemaakt van de layout-taal Sgml. Vorm en inhoud worden daarbij gescheiden. De inhoud wordt opgeslagen in afzonderlijke platte tekstbestanden. Deze worden vormgegeven door het tussenvoegen van instructies (tags). Html werkt net zo; Html is afgeleid van Sgml. In tegenstelling tot Html kent Sgml echter geen vaste ’tags’. Verschillende auteurs kunnen tegelijkertijd aan verschillende stukken tekst werken, maar het uiteindelijke document krijgt pas tijdens de productie zijn uiteindelijke vorm. De hele layout van een document is te wijzigen door de tag-definities aan te passen; de inhoud hoeft daarbij niet te worden veranderd.
Het Sgml-concept had al jaren geleden moeten worden ontwikkeld op basis van client/server-technieken, zodat het gebruik van tekstverwerkers te beperken was geweest tot het schrijven van simpele briefjes. Sgml is buiten de uitgeverswereld eigenlijk nooit aangeslagen, mede omdat tekstverwerkers met veel geweld in de markt gezet zijn. Daarnaast speelt de complexiteit van Sgml een rol; Sgml is moeilijker te begrijpen dan een tekstverwerker.
Het Web en Html hebben ertoe geleid dat iedereen weet dat je vorm en inhoud moet scheiden. Maar noch Sgml (te complex, geen hypertext), nog Html (vaste tags, beperkte structuur) zijn geschikt voor de zakelijke omgeving. XML is dat wel. XML brengt de beste eigenschappen van Sgml en Html binnen ieders bereik. Kom maar op met de volgende generatie XML documentservers! Gestructureerde documenten zijn nuttiger en goedkoper om aan te maken, te onderhouden en te gebruiken.