... | ... | @@ -349,7 +349,7 @@ Es kommen verschiedene Methoden zum Einsatz (vgl. kost-ceco | Studie Webarchivie |
|
|
|
|
|
Durch einen Crawler werden zunächst Informationen über Webseiten eigesammelt, wie das letzte Änderungsdatum und Gültigkeit von Hyperlinks. Ausgehend von einer Staradresse werden gefundene Inhalte in ein Archivobjekt geschrieben (Remote harvesting). Hierbei lassen sich Start- und Endpunkt sowie Abbruchbedingungen eines Archivierungsvorgangs festlegen. Eingebundene Objekte wie Texte, Bilder und Grafiken werden eingesammelt und mit den html- und css-Dateien in einem Archivobjekt gespeichert.
|
|
|
|
|
|

|
|
|

|
|
|
_Homepage der Waybackmachine_ <br><br>
|
|
|
|
|
|
Das bekannteste Projekt dieser Art ist sicherlich das Internet Archive mit dem versucht wird, die globale Entwicklung des World Wide Web zu dokumentieren und den Zustand in chronologisch aufeinander folgenden Phasen so vollständig wie möglich zu archivieren. Zentral ist hierbei die sog. Wayback-Maschine, mit welcher der Zustand einzelner Webseiten dokumentiert wird und über eine Suchmaske abgerufen werden kann (https://archive.org/).
|
... | ... | |