Archiwizacja Webu – aktualny stan metod, badań i zasobów
Florent Thouvenin i współautorzy w rozdziale Web archives zbioru Remembering and Forgetting in the Digital Age (2018) proponują przegląd stanu archiwizacji Webu. To kilkunastustronicowe opracowanie może być dobrym źródłem wiedzy dla wszystkich, którzy chcieliby zainteresować się tą tematyką.
Autorzy definiują archiwum webowe jako process of harvesting data that has been published on the World Wide Web; the main function is to store and to ensure that data is preserved in an archive, and to make the collected data available for research. W poszczególnych częściach opracowania opisują krótko główne techniki archiwizacji Webu oraz strategie udostępniania zbiorów. Proponują też przegląd głównych inicjatyw archiwizacji WWW, umieszczając to w kontekście problemów związanych z utratą zasobów Webu oraz proponując dla zarchiwizowanych zbiorów konkretne zastosowania badawcze. Wspomniany rozdział przedstawia także podstawowe metody gromadzenia zbiorów WWW i ograniczenia dla crawlingu, będącego dziś najpopularniejszą metodą pozyskiwania witryn do archiwizacji.
W rozdziale znalazł się także wątek prawa do bycia zapomnianym. Autorzy przekonują w nim, że problem egzekwowania tego prawa raczej nie powinien dotyczyć archiwów Webowych, ponieważ ich zasoby są publikowane w zupełnie innym kontekście niż w tzw. live Web (WWW na żywo), są trudniej dostępne i wykorzystywane przede wszystkim w konkretnych celach badawczych.
Wartościowym uzupełnieniem rozdziału są przypisy do około 30, nieraz zupełnie podstawowych, opracowań wspomnianych w tekście zagadnień.