... | ... | @@ -5,6 +5,8 @@ |
|
|
1. [Verzeichnisanalyse: Archifiltre](#Verzeichnisanalyse: Archifiltre)
|
|
|
2. [Mails par Archifiltre](#Mails par Archifiltre)
|
|
|
3. [ArchiveWeb.page und ReplayWeb.page](#ArchiveWeb.page)
|
|
|
3.1 [als eigenständige Anwendung](#als eigenständige Anwendung)
|
|
|
3.2 [als Add-On-Erweiterung](#als Add-On-Erweiterung)
|
|
|
4. [Formaterkennung: DROID und Pronom](#DROID und Pronom)
|
|
|
5. [Formatvalidierung: jhove](#Formatvalidierung: jhove)
|
|
|
6. [Technische Metadaten: File Information Tool Set (FITS)](#Technische Metadaten)
|
... | ... | @@ -67,12 +69,14 @@ Es hat sich gezeigt, dass das Programm im Vollbildmodus schneller und zuverläss |
|
|
|
|
|
### <a name="ArchiveWeb.page">ArchiveWeb.page und ReplayWeb.page</a>
|
|
|
|
|
|
https://github.com/webrecorder/archiveweb.page/releases/tag/v0.8.0
|
|
|
https://github.com/webrecorder/archiveweb.page/releases/
|
|
|
https://github.com/webrecorder/replayweb.page/releases
|
|
|
|
|
|
Die Programme dienen der Archivierung von Webseiten im Warc-Format, und stellen als Einzel-Anwendungen unter Windows, Linux und Mac OS eine Alternative zu den gleichnamigen Werkzeugen für den Chrome-Browser dar. Als Beispiel wird hier die Archivierung von Internet-Seiten des Historikers Sebastian Kubon demonstriert.
|
|
|
|
|
|
In ArchiveWeb.page wird zunächst ein neues Archiv erstellt mit Klick auf „create New“ und Angabe eines Titels. Anschließend wird durch Klick auf den blauen Punkt ein Fenster geöffnet in dem die Adresse der zu archivierenden Seite eingetragen wird.
|
|
|
#### <a name="als eigenständige Anwendung">Als eigenständige Anwendung</a>
|
|
|
|
|
|
In [ArchiveWeb.page](https://archiveweb.page/) wird zunächst ein neues Archiv erstellt mit Klick auf „create New“ und Angabe eines Titels. Anschließend wird durch Klick auf den blauen Punkt ein Fenster geöffnet in dem die Adresse der zu archivierenden Seite eingetragen wird.
|
|
|
|
|
|

|
|
|
<br><br>
|
... | ... | @@ -129,7 +133,7 @@ Die im Archiv enthaltenen Seiten können als Ganzes oder einzeln im warc oder wa |
|
|

|
|
|
<br><br>
|
|
|
|
|
|
Die gespeicherten Seiten können mit dem Programm ReplayWeb.page wieder angezeigt werden. Im wacz-Format gespeicherte Webauftritte erscheinen ergonomisch mit Anzeige der Startseite.
|
|
|
Die gespeicherten Seiten können mit dem Programm [ReplayWeb.Page](https://replayweb.page/) wieder angezeigt werden. Im wacz-Format gespeicherte Webauftritte erscheinen ergonomisch mit Anzeige der Startseite.
|
|
|
|
|
|

|
|
|
<br><br>
|
... | ... | @@ -141,6 +145,31 @@ Bei den im Warc-Format gespeicherten Webauftritten muss die Startseite aus einer |
|
|
|
|
|
Die so erzeugten Wacz oder Warc-Archivdateien können anschließend mit dem DIMAG-Ingesttool in das DIMAG-Archiv überführt werden. <br><br>
|
|
|
|
|
|
#### <a name="als Add-On-Erweiterung">Als Add-On-Erweiterungen im Browser</a>
|
|
|
|
|
|
[ArchiveWeb.page](https://archiveweb.page/) und [ReplayWeb.Page](https://replayweb.page/) können auch als Add-On-Erweiterungen genutzt werden. Sie setzten zeitweilig die Nutzung des Chrome-Webbrowsers voraus.
|
|
|
|
|
|
 <br><br>
|
|
|
|
|
|
Im Browser wird ein blauer Knopf in der rechten oberen Ecke angezeigt:
|
|
|
|
|
|
 <br><br>
|
|
|
|
|
|
Hiermit kann eine Webseite mit allen unter der gleichen Domain verlinkten Seiten gecrawlt und im Warc-Format abgespeichert werden:
|
|
|
|
|
|
 <br><br>
|
|
|
|
|
|
Die Ergebnisse können anschließend als Dateien im Warc-Format heruntergeladen und in einem eigenen Verzeichnis abgespeichert werden.
|
|
|
|
|
|
Für die Anzeige wird das Tool ReplayWebpage verwendet:
|
|
|
|
|
|
 <br><br>
|
|
|
|
|
|
Durch Anklicken einer Container-Datei werden die Inhalte aus denen sich die Website zusammensetzt aufgelistet. Durch Auswahl der Startdatei wird die Webseite in ihrer ursprünglichen Form angezeigt:
|
|
|
|
|
|

|
|
|
_Anzeige von https://ichbinhanna.wordpress.com/ mit ReplayWebpage_ <br><br>
|
|
|
|
|
|
### <a name="DROID und Pronom">Formaterkennung: DROID und Pronom</a>
|
|
|
|
|
|
Es handelt sich zum einen um Programme, welche der Formaterkennung und Validierung dienen und vor oder während der Übernahme digitaler Objekte in ein Archiv zum Einsatz kommen, in der Terminologie des OAIS im „Ingest“ oder „pre-Ingest“. Zum anderen sind es Programme, die nach der Übernahme in ein Archiv verwendet werden können, um die Integrität von Objekten zu kontrollieren.
|
... | ... | @@ -354,31 +383,6 @@ Die Ergebnisse der Prüfung können als Report im XML oder HTML-Format angezeigt |
|
|
|
|
|
 <br><br>
|
|
|
|
|
|
### <a name="Webseiten">ArchiveWeb.page</a>
|
|
|
|
|
|
[ArchiveWeb.page](https://archiveweb.page/) und [ReplayWeb.Page](https://replayweb.page/) setzten zeitweilig die Nutzung des Chrome-Webbrowsers voraus, können inzwischen aber auch als Einzelanwendungen unter Mac, Windows und Linux installiert werden:
|
|
|
|
|
|
 <br><br>
|
|
|
|
|
|
Im Browser wird ein blauer Knopf in der rechten oberen Ecke angezeigt:
|
|
|
|
|
|
 <br><br>
|
|
|
|
|
|
Hiermit kann eine Webseite mit allen unter der gleichen Domain verlinkten Seiten gecrawlt und im Warc-Format abgespeichert werden:
|
|
|
|
|
|
 <br><br>
|
|
|
|
|
|
Die Ergebnisse können anschließend als Dateien im Warc-Format heruntergeladen und in einem eigenen Verzeichnis abgespeichert werden.
|
|
|
|
|
|
Für die Anzeige wird das Tool ReplayWebpage verwendet:
|
|
|
|
|
|
 <br><br>
|
|
|
|
|
|
Durch Anklicken einer Container-Datei werden die Inhalte aus denen sich die Website zusammensetzt aufgelistet. Durch Auswahl der Startdatei wird die Webseite in ihrer ursprünglichen Form angezeigt:
|
|
|
|
|
|

|
|
|
_Anzeige von https://ichbinhanna.wordpress.com/ mit ReplayWebpage_ <br><br>
|
|
|
|
|
|
### <a name="matomo">Web-Analytik: matomo</a>
|
|
|
Matomo wird verwendet, um zu wissen, wie oft die Web-Auftritten des Uni-Archivs in einem bestimmten Zeitfenster (einem Tag, einer Woche, einem Monat..) besucht wurden.
|
|
|
Es werden die folgenden Webseiten überwacht:
|
... | ... | |