De nieuwe versies 2 en 3 van de PDF/A-standaard zijn interessant voor document- en informatiespecialisten omdat ze kunnen helpen om beheervraagstukken op te lossen rondom Information Management.
Al bij de introductie van PDF/A werd erop gewezen dat er meerdere versies van de standaard ontwikkeld zouden worden. Zo hadden we tot nu toe vooral te maken met PDF/A-1 dat gebaseerd was op de technische mogelijkheden van PDF versie 1.4. Ondertussen zijn er heel kort achter elkaar twee nieuwe versies gepubliceerd die op latere PDF-versies gebaseerd zijn. De meest belangrijke vernieuwingen zijn:
- Gebruik van het imageformaat JPEG 2000 waardoor kleinere bestandsgroottes mogelijk zijn.
- Paginagrootte t/m 381 km × 381 km (PDF/A-1 is beperkt tot 5,08 m × 5,08 m).
- Insluiten van bestanden (embedden).
Vooral de laatst genoemde vernieuwing is heel interessant voor informatiemanagers, omdat hiermee een aantal probleemstellingen in contentbeheer en information management opgelost kunnen worden. Het embedden van bestanden biedt namelijk de mogelijkheid om een PDF/A-bestand als container te gebruiken voor één of meerdere bijlagen. Het heeft iets weg van een zip-bestand, maar dan zonder de compressie.
Embedden
Om te beginnen: er is een klein verschil tussen PDF/A-2 en 3 met betrekking tot het embedden van bestanden. In PDF/A-2 mogen alleen maar PDF/A-bestanden ingesloten worden – waardoor de oorspronkelijke doelstelling van PDF/A bewaard blijft: een standaard dataformaat voor langetermijnarchivering.
In een PDF/A-3-bestand mag er van alles als bijlagen worden toegevoegd. Je kunt dus een PDF-document archiveren samen met de broninformatie in het oorspronkelijk dataformaat. Hierdoor ontstaan interessante mogelijkheden om bij elkaar horende bestanden als één object te beheren:
- E-mailarchivering – Je kunt een PDF-versie van een e-mail als container gebruiken voor de bijlage(n) en het oorspronkelijke e-mailbestand. Hierdoor is het mogelijk om een gearchiveerde e-mail als basis voor een reply of een forward te gebruiken.
- Archiveren van ontvangen gesigneerde PDF – Stel je wilt binnenkomende berichten (emails, PDFs etc.) in de digitale postkamer voorzien van een timestamp voor archivering. Dit gaat niet lukken bij gesigneerde PDF’s, omdat de nieuwe timestamp de bestaande signatuur ongeldig maakt. Nu kan je de versie met de timestamp en de oorspronkelijke PDF in één PDF/A-3-object opslaan.
- Documentcreatie – Je kunt de oorspronkelijke XML-bestanden samen met het gegenereerde document opslaan.
- Webformulieren – Een ‘geprinte’ versie van het webformulier, zoals het door de klant is ingevuld, samen met de invulgegevens en andere informatie van de webserver.
- Digitale factuur – Leesbare factuur versturen als PDF (ongestructureerde informatie) met in de bijlage de bijbehorende gegevens in een gestructureerd dataformaat, zoals XML, CSV etc. Dit is bijvoorbeeld het vertrekpunt voor de Duitse standaard ZUGFeRD die door steeds meer organisaties wordt toegepast.
Hier is een link naar een uitgebreide discussie over embedden van bestanden in PDF/A.
Langetermijngedachte
Het embedden van bronbestanden biedt interessante mogelijkheden voor contentbeheer en Information Management. Maar het mag duidelijk zijn dat er een nieuwe verantwoordelijkheid voor de informatiemanager ontstaat: het waarborgen dat de ingesloten databestanden leesbaar en bruikbaar blijven voor de afgesproken bewaarperiode. In veel gevallen kunnen tools voor conversie of transformatie helpen om de dataformaten actueel te houden, maar dit wordt moeilijker bij specifieke propriëtaire formaten, zoals MS Office, et cetera.
Het is niet de bedoeling dat de nieuwe PDF/A-formaten het bestaande PDF/A-1 gaan vervangen. Het hangt heel sterk van de use case af en de doelstelling die gekoppeld is aan de archivering. De nieuwe formaten kan je beter als een aanvulling zien waarmee je bepaalde vraagstukken kunt oplossen rondom information management.
Gevolgen voor gebruiker
De nieuwe PDF/A-versies maken gebruik van functies die al lang toegepast kunnen worden in ‘normale’ PDF’s. Daarom kan de gebruiker de nieuwe versies gewoon in zijn huidige Adobe Reader openen. Met de ‘paperclip’ tab krijg je toegang tot een lijst met de embedded bestanden. Door op een bestand met de rechter muis te klikken, kan je het bestand openen; dit gebeurt dan buiten de PDF – je moet wel de benodigde software op je computer geïnstalleerd hebben. Een andere optie is om het bestand te extraheren en op te slaan.
Wel een aandachtspunt zijn ECM-oplossingen die gebruik maken van specifieke viewers die verschillende bestandsformaten (TIFF, PDF, GIF, JPG, Word, et cetera.) kunnen weergeven. Vaak wordt dit toegepast om de gebruikers niet te belasten met verschillende viewerinterfaces. Tot nu toe waren embedded files niet toegestaan in PDF/A en was het dus ook niet nodig dat deze specifieke viewers deze functie ondersteunen. Maar als het bijvoorbeeld gebruik wilt maken van PDF/A-3 voor e-mails en bijlagen, dan is dit wel een aandachtspunt voor je implementatie checklist.
Een mooie ontwikkeling het embedden van informatie in PDF/A.
Heldere uitleg. Dankjewel.
Hi Marianne,
Bedankt voor je reactie. Fijn dat je de uitleg helder vond.
Roberto