|
|
|
|
|
# Werkzeuge im Kontext der Langzeitarchivierung
|
|
|
|
|
|
### Verzeichnisanalyse: Archifiltre
|
|
|
|
|
|
Mit dem frei verfügbaren Programm Archifitre können ganze Verzeichnisse und Verzeichnisbäume mit den enthaltenen Dateien analysiert und überprüft werden.
|
|
|
|
|
|

|
|
|
|
|
|
_Start-Bildschirm Archifiltre_
|
|
|
|
|
|
Eine Installation des Programms erfolgt nicht, unter Windows erfolgt der Programmstart über Auswahl der Datei archifiltre-3.2.2.exe. Während die Informationen auf der Homepage ausschließlich auf Französisch verfügbar sind, kann nach Aufruf des Programms zusätzlich auf Deutsch oder Englisch umgestellt werden.
|
|
|
|
|
|
Über den Windows-Explorer können einzelne Verzeichnisse in dem umrandeten Feld abgelegt werden. Alle Dateien verbleiben an ihrem Ort. Jedes ggfs. vorhandene Unterverzeichnis und jede einzelne Datei werden als ein farblich markiertes Feld dargestellt, welches je nach Größe der Datei bzw. Anzahl der enthaltenen Dateien variiert. Es werden die Anzahl der Dateien und evtl. vorhandene Unterverzeichnisse sowie deren letztes Änderungsdatum angezeigt.
|
|
|
|
|
|

|
|
|
|
|
|
_Verzeichnisprüfung mit Archifiltre_
|
|
|
|
|
|

|
|
|
|
|
|
_Anzeige von Duplikaten einer Datei_
|
|
|
|
|
|
Bei Positionierung des Mauszeigers auf ein einzelnes Feld werden die Metadaten der entsprechenden Datei bzw. des Verzeichnisses angezeigt: Name, Größe, Dateityp, Änderungsdatum und Hashwert. Über die Funktion „Anreicherung“ können manuell Metadaten für jede einzelne Datei vergeben werden. Zusätzlich können über die Funktion „Duplikat“ anhand von Dateigröße, Dateityp und Änderungsdatum evtl. vorhandene Duplikate einer Datei identifiziert und ggfs. gelöscht werden.
|
|
|
|
|
|
Die Farbgebung der Elemente kann nach „Typ“ oder nach „Änderungsdatum“ variiert werden. Bei „Typ“ werden Verzeichnisse gelb gekennzeichnet und Dateien je nach Größe in rot, blau oder violett. Bei „Änderungsdatum“ variiert die Farbgebung in unterschiedlichen blau, gelb und Grautönen.
|
|
|
|
|
|
Auf die Weise können ganze Dateibäume analysiert und u.a. mit Prüfsummen versehen werden. Somit kann das Programm möglicherweise eine Funktion zur Kontrolle der Integrität von Datensätzen in der Langzeitarchivierung erfüllen.
|
|
|
|
|
|
### Mails par Archifiltre ###
|
|
|
|
|
|
Das Programm Mails par Archifiltre dient der Analyse von E-Mail-Postfächern, die mit Outlook erstellt wurden. Dies geschieht durch Visualisierung eines Postfachs mit den enthaltenen Ordnern. Um eine solche Analyse vornehmen zu können, muss das Postfach zunächst als pst-Datei aus Outlook exportiert werden. Dieser Vorgang ist hier beschrieben: https://support.microsoft.com/de-de/office/sichern-der-e-mails-e5845b0b-1aeb-424f-924c-aa1c33b18833
|
|
|
|
|
|
Die pst-Datei wird per Drag & Drop in das Programm Mails par Archifiltre eingelesen.
|
|
|
|
|
|

|
|
|
|
|
|
Dies gelingt oft erst nach mehreren Versuchen, Grund hierfür mag die Größe einer pst-Datei oder die Nutzung über VPN sein. Schließlich werden die Anzahl der enthaltenen Mails und der enthaltenen Ordner angezeigt.
|
|
|
|
|
|

|
|
|
|
|
|

|
|
|
|
|
|
Durch Auswahl des Menüpunktes Debug -> Open and console log pst file wird der Inhalt der pst-Datei grafisch dargestellt.
|
|
|
|
|
|

|
|
|
|
|
|
Auf der linken Seite werden in Kreisform die Domain-Namen angezeigt, von denen E-Mails empfangen wurden. Die Kreise unterscheiden sich in ihrer Größe je nach Anzahl der entsprechenden Mails.
|
|
|
|
|
|
Bei Überfahren der Domain-Namen mit dem Mauscursor wird auf der rechten Seite die Anzahl der von dort empfangenen Nachrichten angezeigt. Durch Auswahl von „Summary“ werden Informationen über das gesamte Postfach angezeigt, wie die Anzahl der empfangenen und gesendeten Nachrichten, Anzahl der Attachments und Anzahl der E-Mail-Kontakte. Der gesamte Inhalt des Postfachs lässt sich im csv, json xslx und eml-Format exportieren.
|
|
|
|
|
|
Es hat sich gezeigt, dass das Programm im Vollbildmodus schneller und zuverlässiger läuft als bei reduzierter Ansicht. Weiter hat sich gezeigt, dass die Analyse großer Postfächer Probleme bereitet, so hat die grafische Analyse der pst-Datei des Postfachs von Herrn Sebastian Kubon (788 MB) nicht funktioniert.
|
|
|
|
|
|
### ArchiveWeb.page und ReplayWeb.page ###
|
|
|
|
|
|
https://github.com/webrecorder/archiveweb.page/releases/tag/v0.8.0
|
|
|
https://github.com/webrecorder/replayweb.page/releases
|
|
|
|
|
|
Die Programme dienen der Archivierung von Webseiten im Warc-Format, und stellen als Einzel-Anwendungen unter Windows, Linux und Mac OS eine Alternative zu den gleichnamigen Werkzeugen für den Chrome-Browser dar. Als Beispiel wird hier die Archivierung von Internet-Seiten des Historikers Sebastian Kubon demonstriert.
|
|
|
|
|
|
In ArchiveWeb.page wird zunächst ein neues Archiv erstellt mit Klick auf „create New“ und Angabe eines Titels. Anschließend wird durch Klick auf den blauen Punkt ein Fenster geöffnet in dem die Adresse der zu archivierenden Seite eingetragen wird.
|
|
|
|
|
|

|
|
|
|
|
|

|
|
|
|
|
|
Die entsprechende Seite wird angezeigt und in das Archiv mit dem gewählten Titel gespeichert. Der Fortgang des Archivierungsprozesse wird durch ein kleines Viereck oben rechts angezeigt. Erscheint dieses grün, ist die entsprechende Seite archiviert.
|
|
|
|
|
|
Der Prozess kann fortgesetzt werden, in dem die auf der Seite enthaltenen Hyperlinks angewählt werden. Die entsprechenden Seiten werden dann ebenfalls archiviert. Auf diese Weise können Webseiten mit weiteren durch Hyperlinks verlinkten Seiten in ein Archiv geschrieben werden.
|
|
|
|
|
|
In diesem Fall wird nur die unter der oben eingetragenen Domain vorhandene Seite ohne weitere verlinkte Seiten archiviert.
|
|
|
|
|
|

|
|
|
|
|
|
In einer Übersicht können die mit ArchivWeb.page erstellten Archive angezeigt werden:
|
|
|
|
|
|

|
|
|
|
|
|
Bei Auswahl eines Archivs werden die enthaltenen Seiten angezeigt. Da es sich im Fall von Kubon um eine einzelne Seite handelt und keine verlinkten Seiten berücksichtigt wurden, funktionieren vorhandene Hyperlinks nicht.
|
|
|
|
|
|
Die im Archiv enthaltenen Seiten werden unter dem im Html-Code mit \<title> </title> vergebenen Titel aufgeführt.
|
|
|
|
|
|

|
|
|
|
|
|
Bei Aufruf der archivierten Seite werden die Archivhierarchie und die ursprüngliche Domain angezeigt
|
|
|
|
|
|

|
|
|
|
|
|
Ein etwas komplexeres Beispiel stellt der ebenfalls von Kubon unter dem Titel „#IchBinHanna“ erstellte Webauftritt dar.
|
|
|
|
|
|

|
|
|

|
|
|
|
|
|
Nach Erstellung des Archivs und Angabe der Domain wird zunächst die Startseite archiviert. Durch Auswahl der einzelnen oberen Menüpunkte werden anschießend der Reihe nach die weiteren verlinkten Seiten in das Archiv geschrieben.
|
|
|
|
|
|
Der Fortgang des Archivierungsprozesses wird durch ein kleines Viereck oben rechts angezeigt. Leuchtet dieses grün, ist die Archivierung der jeweiligen Seite abgeschlossen.
|
|
|
|
|
|

|
|
|
|
|
|
Die im Archiv enthaltenen Seiten können als Ganzes oder einzeln im warc oder wacz-Format aus dem Programm heraus abgespeichert werden.
|
|
|
|
|
|

|
|
|
|
|
|

|
|
|
|
|
|
Die gespeicherten Seiten können mit dem Programm ReplayWeb.page wieder angezeigt werden. Im wacz-Format gespeicherte Webauftritte erscheinen ergonomisch mit Anzeige der Startseite.
|
|
|
|
|
|

|
|
|
|
|
|
Bei den im Warc-Format gespeicherten Webauftritten muss die Startseite aus einer Gesamtmenge an Dateien herausgesucht und aufgerufen werden.
|
|
|
|
|
|

|
|
|
|
|
|
Die so erzeugten Wacz oder Warc-Archivdateien können anschließend mit dem DIMAG-Ingesttool in das DIMAG-Archiv überführt werden.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|