Czy WWW to archiwum?
Krótki fragment rozdziału autorstwa Janne Nielsen, opublikowanego w zbiorze Towards a Philosophy of Digital Media (2018), to jeden z najbardziej zgrabnych opisów problemu Webu jako archiwum, na jaki ostatnio natrafiłem. Czy WWW powinniśmy traktować jako archiwum lub bibliotekę? Czy zasadne jest traktowania zasobów Webu jako zawsze dostępnych?
W Is the Web an Archive? autorka przytacza najpierw dość rozpowszechnione opinie o WWW jako archiwum, w którym wszystko, co dzieje się w sieci, jest rejestrowane, a informacje przechowywane są w nieskończoność. Często pogląd ten łączy się z obawą o skutki takiej permanentnej dostępności – Nielsen przytacza tutaj problem prawa do zapomnienia, przysługującego każdemu prawa do usunięcia dotyczących go danych i zasobów, zresztą nie tyko tych publikowanych online w sieci WWW. Wydaje się przy tym, że dyskusje wokół prawa do zapomnienia zbyt często przyjmują bezkrytycznie tezę o Webie jako skrajnie efektywnym archiwum, nie odnosząc się do badań wykazujących jego zmienność i tymczasowość zasobów. Nielsen między totalnym archiwum jakim ma być Web a wrażliwymi zasobami użytkowników stawia jednak potężnego pośrednika – wyszukiwarki internetowe, bez których zasoby te są jedynie potencjalnie dostępne.
Ostatecznie Nielsen odrzuca metaforę Webu jako archiwum – być może w określonej perspektywie może on pełnić taką rolę, nie jest jednak stałym i stabilnym źródłem, co wynika nawet z jego technicznych podstaw. Na przykład adresy URL, co do zasady mające być uniwersalne i niezmienne, masowo przestają być aktywne (link rot), lub zmieniają się treści, które są nimi opisane – stąd między innymi koncepcja identyfikatorów DOI jako dodatkowego zabezpieczenia stabilności linków lub próby wprowadzenia do standardu HTTP rozwiązań pozwalających na dostęp do historycznych wersji treści pod określonymi adresami. Nielsen w swoim rozdziale nie przytacza tych przykładów, proponuje jednak podstawowy przegląd literatury dotyczącej i samej archiwalnej natury Webu, jak i opisującej wyniki badań stabilności adresów URL czy dostępności stron WWW w czasie. Na uwagę zasługuje próba porównania potencjału archiwalnego Webu z innymi mediami, podsumowana cytatem z Megan Ankerson: znacznie łatwiej jest odnaleźć film z 1924 roku niż stronę internetową z 1994 roku.