PDF/A – sichere Langzeitarchivierung digitaler Dokumente

,
Die digitale Archivierung ist weiter auf dem Vormarsch

Wie bei einem Schreiner die Säge nicht wegzudenken ist, so darf auf keinem Computer die Adobe-Software zur Erstellung von PDF-Dateien fehlen. Ein digitaler Dokumentenaustausch ist heutzutage ohne PDF nicht mehr denkbar. PDF-Dateien sind zum weltweiten Standard geworden. Doch was hat es mit dem PDF/A Format auf sich?

Das im Jahr 1993 von Adobe entwickelte Dateiformat wird mittlerweile von verschiedenen Spezialformaten ergänzt und deckt damit die Anforderungen von unterschiedlichen Branchen an digitales Arbeiten, Abspeichern und Archivieren ab. PDF/A ist eines dieser Spezialformate und dient der Langzeitarchivierung von denjenigen Dokumenten, die originalgetreu und unveränderbar gesichert werden sollen.

Umstieg von der analogen Welt in die digitale Welt mit PDF/A

PDF/A Formate eignen sich zur Langzeitarchivierung

Analoge Achive gibt es immer weniger

Weltweit machen seit Jahren Unternehmen und Behörden den Schritt weg von Papierakten und hin zum sogenannten „papierlosen Büro“. In diesem arbeiten die Mitarbeiter nur noch mit digitalen Akten bzw. wandeln Papierdokumente in digitale Dokumente um. Analoge Schriftstücke werden (aufgrund der großen Mengen an Papier häufig von externen Firmen) eingescannt und in einem Dokumenten-Management-System (DMSrevisionssicher abgelegt. Wichtig hierbei ist, dass das Unternehmen dabei die rechtlichen Rahmenbedingungen aus dem Handelsrecht und die jeweiligen Datenschutzrichtliniendes Landes einhält. Ein nicht zu unterschätzendes Unterfangen, wenn man bedenkt, dass digitale Dokumente manipuliert werden könnten und somit – im Gegensatz zu Papierdokumenten – nicht mehr revisionssicher wären.

Anforderungen an die digitale Arbeitswelt

Vor diesem Hintergrund entstand die Anforderung, digitale Dokumente so zu archivieren, dass der Inhalt auch nach langer Zeit noch in derselben Qualität und ohne Abweichungen vom Original dargestellt werden kann. Auch sollte das Dateiformat so gestaltet sein, dass eine Manipulation des Dateiinhaltes nicht mehr möglich war.
Im Jahr 2005 hat daraufhin Adobe das PDF-Format um die Norm PDF/A ergänzt (das „A“ steht für Archivierung) und die ISO-Zertifizierung für das digitale Langzeitarchivieren erhalten.
Doch was ist der Unterschied zum allseits bekannten „normalen“ PDF-Format?

Der Unterschied zwischen PDF und PDF/A

Eine PDF-Datei (PDF steht für „Portable Document Format“) kennt fast jeder, der mit Computern zu tun hat. Sie scannen ein Papierdokument ein und erhalten eine PDF-Datei, oder Sie wandeln eine bereits vorhandene digitale Datei mittels eines Programmes in ein PDF um. Was hat es aber nun mit einer PDF/A-Datei auf sich?
Eine PDF/A-Datei ist eine reduzierte Version einer PDF-Datei. Alle Funktionen, die nichts mit einer Archivierung zu tun haben, wurden gestrichen. Dabei gehen keine Daten verloren, nur das Format ändert sich.

Mehr zum Thema:
Was ist Seamonkey?

ISO-Standard für Langzeitarchivierung

hammer 802301 640

Den rechtlichen Vorgaben muss entsprochen werden

Eine Langzeitarchivierung von digitalen Schriftstücken stellt bei Unternehmen oder Behörden aus handelsrechtlichen Gründen bestimmte Anforderungen an die Aufbewahrung. Es ist problemlos möglich, eine PDF-Datei mit einem PDF-Writer zu verändern. Vertrags- oder steuerrelevanten Schriftstücke, wie zum Beispiel Rechnungen oder Handelsbriefe, müssen aber mehrere Jahre lang in der Originalabbildung vorhanden bleiben. Adobe hat aus diesem Grund das Format PDF/A für eine rechtlich einwandfreie Langzeitarchivierung entwickelt und im Jahr 2005 die erste Version auf den Markt gebracht (PDF/A-1). Es folgten die Versionen A-2 (2011) und A-3 (2012). PDF/A ist seit 2005 der ISO-Standard für die Langzeitarchivierung digitaler Dokumente.

Unterscheidung zwischen PDF/A1a und A-1b

Man unterscheidet bei der Version PDF/A-1 zwischen zwei Abstufungen:
Der Level 1-b steht für „basic, übersetzt grundsätzlich/grundlegend. Er erfüllt die Mindestanforderungen der ISO-Norm und stellt eine eindeutige visuelle Reproduzierbarkeit sicher. Alle eingefügten Bilder sind fest im Dokument eingebunden. Die Textbausteine sind in Unicode-Darstellung, damit sie für die Ewigkeit oder zumindest für die vom Handelsrecht vorgeschriebene Dauer reproduzierbar bleiben.

Der Level 1-a steht für „accessible, übersetzt zugänglich und ist eine Steigerung zum Level 1-b: Dieses Format setzen Sie dann ein, wenn die Dateien auch auf mobilen Endgeräten verfügbar sein sollen und Sie die sogenannte „Barrierefreiheit“ gewährleisten wollen. Das bedeutet eine identische Darstellung ohne Einschränkungen bei Menschen mit Behinderung, zum Beispiel bei blinden Menschen.

Somit sollten Sie bei der Archivierung immer das Format A-1a benutzen, um alle Anforderungen abzudecken.

Besonderheiten von PDF/A-Dateien:

– PDF/A-Dateien benötigen weniger Speicherplatz als normale PDF-Dateien.
– Eine Verschlüsselung oder ein Sperren (zum Beispiel durch einen Passwortschutz) ist nicht möglich.
– Es gibt eine exakte Hinterlegung und Definition der Farbprofile.
Links auf Webseiten oder externen Inhalt sind nicht gestattet, da diese dynamisch sind und sich verändern können.
– Es gibt keine dynamischen Funktionen wie zum Beispiel Audio- oder Videodateien.
– Es sind digitale Signaturen hinterlegt.
– Transparente Objekte oder Layer (Ebenen) sind nicht erlaubt.
– Eine PDF/A1a-Datei hat eine Kennzeichnung in Form von Metadaten nach XMP-Standard.
– PDF/A1a-Dateien dürfen keine eingebetteten Daten enthalten.

pdf 155498 1280

Das PDF-Symbol

Fazit

Für eine Langzeitarchivierung von digitalen Dokumenten ist die Nutzung von PDF/A unumgänglich. Welche Norm Sie nehmen (1a1b, 2 oder 3) hängt davon ab, für welchen Zweck Sie die Daten sichern wollen.
Da letztendlich beim Speichern nicht klar ist, wer zukünftig die Dokumente lesen soll oder will, sollten Sie immer die höchste Normstufe wählen.

Mehr zum Thema:
Was ist Sagan? – Eine Einführung in die Log-Analyse mit Sagan