De Koninklijke Bibliotheek wil in 2013 ongeveer 10 procent van alle Nederlandse boeken, kranten en tijdschriften die sinds 1470 zijn verschenen, digitaliseren. Het gaat om ongeveer 75 miljoen pagina's. Van die klus wordt het scannen van 13 miljoen pagina's uitbesteedt. Pagina voor pagina wordt het cultureel erfgoed voor de eeuwigheid bewaard.
Aan de A6 bij Lelystad, tussen akkers die reiken tot de horizon, liggen de bedrijfspanden van Karmac. Het bedrijf is samen met twee andere documentdienstverleners tot 2011 aangewezen als voorkeursleverancier voor een digitaliseringklus van de Koninklijke Bibliotheek. Wie denkt dat bij het werk weinig mensenhanden nodig zijn, komt bedrogen uit. In één van de ruime productiehallen scant en controleert een groep van vijfentwintig medewerkers tijdschriften uit een ver verleden. De bladen worden pagina voor pagina omgeslagen.
Voor een medewerkster ligt de veertiende jaargang van Het Sociaal Democratisch Maandschrift uit 1901. Het tijdschrift dat is ingebonden in een kaft, rust op een tafel waarvan twee delen afzonderlijk in hoogte te verstellen zijn. Zo blijven de bladzijden van het opengeslagen boek altijd op dezelfde lijn, ook als het grootste deel van de pagina's naar één kant is geslagen. Na het omslaan van de pagina daalt een glasplaat op het papier neer.
Als de medewerker 'afdrukt' doet de lijnscanner met Zeutschel-camera die boven de tafel hangt, zijn werk. In het blauwe licht van de scanner wordt in ongeveer zes seconden een scan gemaakt. De digitale bladspiegel wordt direct weggeschreven naar de server die dagelijks meerdere terabytes aan bestanden van deze afdeling ontvangt.
Fotografie
'Eigenlijk zijn we hier bezig met fotografie', zegt Rob van Santen, directeur van Karmac Microfilm Systems, het bedrijfsonderdeel dat de opdracht uitvoert. Hij doelt op de zestien cabines met blauwe gordijnen die de storende invloed van daglicht moeten voorkomen. Door de cabines heeft de productiehal meer iets weg van een fotostudio. Van Santen: 'De Koninklijke Bibliotheek stelt enorm hoge eisen aan de kwaliteit. Deze documenten worden bewust niet met een doorvoerscanner verwerkt. Beweging neemt de scherpte weg en zorgt voor ruis. Een robot zou de pagina om kunnen slaan maar een medewerker heeft er gevoel bij.'
Het papier van de tijdschriften verkeert vaak in slechte staat. Doordat in het begin van de twintigste eeuw goedkope papiersoorten werden gebruikt, verzuurt het materiaal snel. Haast is geboden om tijdschriften te digitaliseren voor ze van ellende uit elkaar vallen.
Beeldbewerking is uit den boze
De tijdschriften zijn in speciale kratten van de Koninklijke Bibliotheek in Den Haag naar Lelystad vervoert. De bibliotheekmedewerkers hebben de tijdschriften gecontroleerd en voorzien van een unieke code. De medewerker van Karmac controleert de code en scant vervolgens pagina voor pagina het tijdschrift.
Na het scannen wordt de digitale versie van het boek gecontroleerd. Bij twijfel bladert de medewerker even terug in het originele tijdschrift dat binnen handbereik ligt. Op het scherm verschijnt een artikel uit De Hollandsche Revue met de titel 'De Spiegel der IJdelheid'. Van Santen legt uit: 'De Koninklijke Bibliotheek stelt als eis dat aan de boven- onder- en zijkanten van de scan een randje van circa twintig pixels te zien is van de zwarte tafel waar het boek op ligt. Zo weten ze zeker dat het origineel volledig gescand is. Beeldbewerking, kleurcorrectie en het verscherpen van afbeeldingen is niet toegestaan. Op het scherm verschijnt het openingsartikel van de veertiende jaargang van het Sociaal Democratisch Maandschrift. De tekst luidt: 'De geschiedenis van het Nederlandse volk moet nog geschreven worden.' Ook die publicatie is voor de eeuwigheid vastgelegd.
Scan-software
Voor het scannen maakt Karmac gebruik van het softwarepakket Omniscan 12 en Imaging Kit van leverancier Zeutschel. Dat bedrijf levert ook de scanapparatuur.
OCR
De digitale bestanden worden met hulp van software voor optical character recognition (ocr) doorzoekbaar gemaakt. Die klus wordt uit kostenoverwegingen door de KB uitbesteed aan bedrijven in India.
Met welke bit(kleuren)diepte worden de scans gemaakt? Ouderwets 24-bits of hoger?