Portable document format of pdf is niet alleen de de facto, maar ook de in 2008 door ISO erkende open standaard voor universeel uitwisselbare elektronische documenten en formulieren. Adobe Acrobat is al lang niet meer de enige tool waarmee pdf’s kunnen worden gecreëerd, bewerkt, beheerd en verspreid. Uit de tientallen alternatieve pd-tools selecteerden we drie populaire (CuteFTP/Ghostwriter, Foxit Phantom en Nuance PDF Converter) en vergeleken die met het origineel.
De geschiedenis van portable document format (pdf) gaat terug tot het begin van de jaren negentig, toen de behoefte ontstond om elektronische documenten eenvoudiger te kunnen uitwisselen tussen verschillende computersystemen. Een 'universeel' documentformaat zou heel wat compatibiliteitsproblemen oplossen. Pdf was in die begindagen zeker niet het enige 'universele' documentformaat, maar het werd wel de de facto standaard, voornamelijk omdat Adobe zijn Reader, het programma om pdf's te lezen, gratis verspreidde. Ondertussen zijn er naar schatting 160 miljoen pdf-bestanden terug te vinden op internet en heeft 90 procent van alle met internet verbonden computers een pdf-leesprogramma aan boord. Dat zal dan in veel gevallen Adobe Reader zijn, maar er zijn ook andere pdf-lezers verkrijgbaar. Allemaal lezen ze tegenwoordig nog steeds documenten die gecreëerd werden met Acrobat 1.0 uit 1993. Acrobat, de tool om pdf's te creëren, zit al aan versie 10.
Het pdf-formaat zelf draagt momenteel versienummer 1.7, daterend uit 2006. Sinds 2008 is die versie ook erkend als ISO-standaard 32000-1:2008. Toekomstige wijzigingen aan het pdf-formaat worden besproken in de technische comités van de standaardenorganisatie ISO en niet meer door Adobe zelf ontwikkeld. Pdf 2.0 laat voorlopig nog op zich wachten.
Pdf-extensies
Adobe creëerde echter wel eigen extensies voor het pdf-formaat; dergelijke extensies zijn trouwens toegelaten door en beschreven in de ISO-standaard uit 2008. Acrobat 9.0 introduceerde in 2008 bijvoorbeeld PDF Extension Level 3. Die extensie laat onder andere toe om multimedia zoals Flash te integreren in pdf's. Ze voorziet verder in sterkere 256-bit AES-encryptie van pdf-documenten. PDF Extension Level 5 uit 2009 (Acrobat 9.1) ondersteunt versie 3.0 van XFA (XML Forms Architecture)-formulieren; dit is een door het Amerikaanse bedrijf JetForm bedachte uitbreiding van XML die specifiek bedoeld is voor het creëren van webformulieren. De extensies zitten niet in de ISO-standaard, maar kunnen daar in de toekomst wel in terecht komen. Alle pdf-versies zijn achterwaarts compatibel. Versie 1.7 bevat alles wat ook in versies 1.0 tot en met 1.6 aanwezig is. Pdf-software van andere bedrijven dan Adobe zelf ondersteunt doorgaans ook alle pdf-formaten van 1.0 tot en met 1.7. Als dergelijke software 1.7 ondersteunt, is het per definitie compatibel met de ISO 32000-1:2008 standaard. De extensies zijn echter specifiek voor Adobe Acrobat en worden dus niet noodzakelijkerwijs door alternatieve software ondersteund.
Andere ISO-standaarden
Het pdf-verhaal stopt overigens niet met de ISO-standaard uit 2008 of de toekomstige pdf 2.0 ISO-standaard. Er bestaan verschillende andere ISO-standaarden die betrekking hebben op pdf en die niet noodzakelijkerwijs door alle creatiesoftware worden ondersteund. Het zou te ver voeren om ze allemaal uitgebreid te behandelen. In de tabel die bij dit artikel hoort, staat een overzicht van de belangrijkste standaarden. We vermelden daar ook welke standaarden de geteste pakketten ondersteunen.
Op één standaard, namelijk pdf/a (ISO 19005) uit 2005, willen we toch even dieper ingaan. Die 'pdf for archive'-standaard is ontwikkeld om elektronische documenten lange tijd te bewaren. De standaard is gebaseerd op pdf 1.4 (geïmplementeerd in Adobe Acrobat 5 uit 2001), maar er zijn allerlei varianten die pdf/a laten aansluiten bij pdf 1.7 en dus ISO 32000-1. Pdf/a is een subset van pdf die allerlei zaken weglaat die niet geschikt zijn voor langetermijnarchivering: audio, video, javascript, encryptie… Pdf/a verplicht ook om metadata toe te voegen aan documenten en dit op een standaardmanier te doen. Verder moeten alle fonts en colorspaces in het document worden ingesloten, zelfs 'standaard' fonts zoals Times. Als je documenten om een of andere reden voor langere termijn moet archiveren, is het gebruik van pdf/a aan te bevelen. Pdf-leessoftware die zegt compatibel te zijn met pdf/a moet ook aan bepaalde vereisten voldoen die beschreven worden in de ISO-standaard. Weinig software voldoet echter aan die vereisten. Van de in deze test besproken producten is alleen Adobe Acrobat zelf helemaal compatibel met pdf/a. CutePDF is dat helemaal niet. Foxit Phantom en Nuance PDF Converter zijn het slechts gedeeltelijk. Iets om rekening mee te houden als je de pdf-creatiesoftware voor archiveringsdoeleinden wil gebruiken…
Alternatieven voor Adobe Acrobat
Adobe Acrobat was ooit het enige programma waarmee pdf's konden worden gecreëerd en bewerkt. Iedereen mag echter software ontwikkelen om pdf's te lezen of aan te maken. Adobe heeft wel de patenten op het pdf-formaat, maar verleent aan iedereen die het wil royaltyvrije licenties. Het resultaat is dat er zelfs volledig gratis software bestaat waarmee pdf's kunnen worden aangemaakt of bewerkt. Een van de bekendste is GNU Ghostscript, dat als 'render'-basis wordt gebruikt door verschillende andere (soms gedeeltelijk te betalen) tools, waaronder het in deze test besproken CutePDF. Kantoorsoftware zoals Microsoft Office en OpenOffice.org kan documenten standaard in pdf exporteren. OpenOffice.org kan ook pdf's lezen als je de multiplatform Oracle PDF Import Extension installeert. Dus zonder een cent uit te geven, kun je al heel wat doen op pdf-vlak. Waarom zou je dan toch nog investeren in commerciële pdf-software? Dat kan zijn om het grotere gebruiksgemak, de betere integratie van alle functies, meer functionaliteit, snellere prestaties, mogelijkheden voor batchwerwerking, voldoen aan specifieke standaarden of specifieke functies zoals de mogelijkheid om elektronische formulieren te creëren en te verwerken.
Geteste producten
Dat er een markt bestaat voor pdf-creatiesoftware, bewijst Adobe, dat zeer regelmatig, bijna elk jaar, nieuwe versies uitbrengt van Acrobat. Ondertussen zitten we aan versie 10, ofwel Adobe Acrobat X.
Dat die markt bestaat, bewijst ook het grote aanbod aan commerciële alternatieven voor Acrobat. Uit dat grote aanbod hebben we er drie gekozen om ze te vergelijken met het origineel: CuteFTP, Foxit Phantom en Nuance PDF Converter. We hebben van al deze pakketten de pro-versies getest, bestemd voor bedrijfsgebruik.
Testmethode
We hebben de software geïnstalleerd op een doorsnee zakelijke desktop-pc, een Fujitsu Esprimo met Intel Core 2 cpu aan 2,4 GHz, 4 GB geheugen, Nvidia Quadro NVS 440 en Windows 7 Ultimate. Deze pc haalt een Windows Prestatie Index van 3,6. We hebben een aantal snelheidstesten uitgevoerd. Zo hebben we een scan van een dik Engelstalig boek met meer dan 150.000 woorden, tabellen, voetnoten en 37 illustraties via ocr in computertekst omgezet en gemeten hoe lang de software daarvoor nodig had. We hebben natuurlijk ook bekeken wat de kwaliteit van de ocr was. Ditzelfde document hebben we geconverteerd naar pdf/a en ook daarvan hebben we de tijd gemeten. Daarna hebben we gemeten hoe lang het duurde om ditzelfde document te converteren naar Word 2010. Ten slotte hebben we gemeten hoe lang het duurt om het 63.000 woorden tellende Word-manuscript van Ludo Schildermans' nieuwe thriller Getekend (Houtekiet, mei 2011) te converteren naar PDF formaat 1.5. We hebben uiteraard ook bekeken wat de kwaliteit was van de conversie. Het boek bevat enkele speciale accenten en lay-out elementen waarin de software zich in principe zou kunnen verslikken. De resultaten van alle metingen vind je terug in de tabel die bij dit artikel hoort. In die tabel vind je ook een zeer gedetailleerd overzicht van de mogelijkheden van de besproken software. De tabel maakt integraal deel uit van deze test.
Kwaliteit van ocr en conversie naar Word
Alleen Adobe Acrobat, Nuance PDF Converter en Foxit Phantom PDF Suite ondersteunen ocr. Foxit ondersteunt echter het Nederlands als taal niet. We gebruikten daarom een Engelstalig testdocument (Eric Hobsbawm's Age of Capital 1848-1875 uit 1975). Adobe Acrobat ocr't het snelst, PDF Converter het traagst. De verschillen zijn echter niet dramatisch groot: van iets minder dan tien minuten voor de snelste (Adobe) tot iets meer dan 13 minuten voor de traagste (Nuance). Dat is toch een goede score voor zo'n omvangrijk bestand. De nauwkeurigheid van de tekstherkenning is verrassend hoog: bijna foutloos. Ook de illustraties worden perfect omgezet.
Alleen Adobe Acrobat en Nuance PDF Converter konden deze test-pdf vervolgens bewaren in Word-formaat. CutePDF en Foxit Phantom PDF Suite ondersteunen dit niet. CutePDF kan een pdf wel bewaren in aparte plaatjes (png, jpg etc.), terwijl Foxit Phantom eventueel de tekst apart kan bewaren in txt-formaat. Dan gaat de lay-out echter uiteraard volledig verloren.
Hoewel we het testdocument eerder al door de pdf-programma's zelf hadden laten omzetten naar computertekst, voeren Adobe Acrobat en Nuance PDF Converter de optische karakterherkenning opnieuw uit wanneer we het bestand in Word-formaat bewaren. Daardoor duurt het converteren naar Word even lang of zelfs langer dan het in leesbare computertekst omzetten van het originele Engelstalige boek. Wellicht komt dat doordat de programma's proberen de oorspronkelijke lay-out zoveel mogelijk te behouden. Adobe slaagt daar overigens veel beter in dan Nuance. Bij Nuance verspringt het lettertype voortdurend, met als resultaat dat pagina's en paginanummers verschuiven en er zelfs witte pagina's tussen de gescande pagina's worden geplaatst. Nuance lijkt wel de lay-out van de tabellen in het boek beter bewaard te hebben.
Kwaliteit van Word-naar-pdf conversie
Alle vier de programma's converteren het Word-bestand met het typoscript van Schildermans' boek Getekend foutloos. Alle programma's doen de conversie in 4 à 5 seconden; alleen Adobe Acrobat heeft met 42 seconden aanzienlijk meer tijd nodig.
Algemene conclusie
Zoals verwacht presteert Adobe Acrobat X Pro veruit het best. Acrobat biedt de meeste features, beantwoordt het best aan de verschillende standaarden en is ook snel. Maar Acrobat is ook erg duur. Misschien heb je alle mogelijkheden niet nodig. Nuance PDF Converter Professional is dan een goedkoper alternatief met negentig procent van dezelfde mogelijkheden. Foxit Phantom PDF Suite kost hetzelfde als PDF Converter, maar biedt minder mogelijkheden. Geen reden dus om deze oplossing te kiezen. CutePDF Professional biedt niet veel meer dan verschillende gratis alternatieven en kunnen we daarom niet aanraden.
De Kern
* Portable document format is sinds 2008 de ISO-standaard voor uitwisselbare documenten
* Adobe Acrobat blijft de standaard voor creatie, bewerken en beheer van pdf's, maar het is wel erg duur.
De Serie
Deel 1: PDF is sinds 2008 ISO-standaard
Deel 2: CutePDF Professional
Deel 3: Adobe Acrobat X Pro
Deel 4: Foxit Phantom PDF Suite
Deel 5: Nuance PDF Converter Professional
Jammer dat de open source ‘evince’ niet vermeld wordt.
Deze ondersteund ISO 32000