Archiwizacja Webu – aktualny stan metod, badań i zasobów

Autor Marcin Wilkowski Opublikowano 4 grudnia 2018 Publikacje

Florent Thouvenin i współautorzy w rozdziale Web archives zbioru Remembering and Forgetting in the Digital Age (2018) proponują przegląd stanu archiwizacji Webu. To kilkunastustronicowe opracowanie może być dobrym źródłem wiedzy dla wszystkich, którzy chcieliby zainteresować się tą tematyką.

Autorzy definiują archiwum webowe jako process of harvesting data that has been published on the World Wide Web; the main function is to store and to ensure that data is preserved in an archive, and to make the collected data available for research. W poszczególnych częściach opracowania opisują krótko główne techniki archiwizacji Webu oraz strategie udostępniania zbiorów. Proponują też przegląd głównych inicjatyw archiwizacji WWW, umieszczając to w kontekście problemów związanych z utratą zasobów Webu oraz proponując dla zarchiwizowanych zbiorów konkretne zastosowania badawcze. Wspomniany rozdział przedstawia także podstawowe metody gromadzenia zbiorów WWW i ograniczenia dla crawlingu, będącego dziś najpopularniejszą metodą pozyskiwania witryn do archiwizacji.

W rozdziale znalazł się także wątek prawa do bycia zapomnianym. Autorzy przekonują w nim, że problem egzekwowania tego prawa raczej nie powinien dotyczyć archiwów Webowych, ponieważ ich zasoby są publikowane w zupełnie innym kontekście niż w tzw. live Web (WWW na żywo), są trudniej dostępne i wykorzystywane przede wszystkim w konkretnych celach badawczych.

Wartościowym uzupełnieniem rozdziału są przypisy do około 30, nieraz zupełnie podstawowych, opracowań wspomnianych w tekście zagadnień.

Thouvenin F., Hettich P., Burkert H., Gasser U. (2018) 4 Web Archives. In: Remembering and Forgetting in the Digital Age. Law, Governance and Technology Series, vol 38. Springer, Cham, doi.org/10.1007/978-3-319-90230-2_6

Treść dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 4.0 Blog naukowy, publikacje i materiały edukacyjne pracowni w 2018 roku powstały w ramach projektu Upowszechnianie wiedzy o archiwizacji Webu i metodach korzystania z historycznych zasobów WWW w instytucjach publicznych i sektorze NGO, prowadzonego przez Stowarzyszenie EBIB i finansowanego przez MNISW w programie Działalność Upowszechniająca Naukę (DUN).