Studium przypadku: archiwizacja Webu na University of Victoria

Archiwizacja stron WWW jest na University of Victoria prowadzona od 2013 roku. Instytucją odpowiedzialną za projekt archiwizacyjny jest biblioteka uniwersytecka. Ściśle związane jest to z charakterem kolekcji, która traktowana jest jako logiczne rozwinięcie zbiorów gromadzonych przez instytucję.

Według bibliotekarzy takie ujęcie pozwala także na wypełnienie ważnej luki. Największe Archiwum Webu (mowa tu rzecz jasna o zbiorach gromadzonych przez fundację Internet Archive) ma bardzo ogólny profil, natomiast narodowe archiwa koncentrują się na zabezpieczaniu oficjalnych stron rządowych lub domeny krajowej. Zbiór z University of Victoria traktowany był od początku jako uzupełnienie, swego rodzaju trzecia droga, koncentrująca się na zbiorach o walorach kulturowych.

Podjęcie decyzji dotyczącej szczegółowego profilu zbiorów zajęło jednak aż osiem miesięcy. W końcu zdecydowano się na następujące zasoby:

  • strony WWW związane z obchodami pięćdziesięciolecia Uniwersytetu;
  • specjalne kolekcje tematyczne, będą rozwinięciem istniejących kolekcji dotyczących zagadnień związanych z anarchizmem, transgenderyzmem, lokalnością i działaniem organizacji walczących o środowisko;
  • strony WWW lokalnego rządu;
  • strony WWW związane z cyfrową humanistyką.

Co ciekawe, w pierwszej kolejności podjęto decyzje dotyczące kwestii technicznych – zdecydowano się na wykupienie subskrypcji i korzystanie z usług Archive-It jeszcze zanim zainicjowano dyskusję na temat szczegółowego charakteru kolekcji.

Bardzo szybko okazało się także, że zabezpieczenie tego typu zbiorów wiąże się z wieloma trudnościami organizacyjnymi, szczególnie odczuwanymi właśnie przez biblioteki. Instytucje te często odpowiedzialne są za katalogowanie historycznych zbiorów WWW, sam system działania więcej ma jednak wspólnego z tworzeniem zbiorów archiwalnych niż bibliotecznych. Prace bardzo ułatwiło więc włączenie w nie osób związanych z uniwersyteckimi archiwami.

Kolejnym wyzwaniem okazało się kwestie prawnoautorskie – brak ogólnoprzyjętych rozwiązań i niejasny status prawny tego typu zbiorów sprawił, że kolejne kolekcje udostępniane są stopniowo. Naczelną zasadą dla pracowników tworzących archiwum jest bowiem pełne wyjaśnienie kwestii prawnych dotyczących każdego z udostępnianych obiektów.

Ciekawą częścią omawianego studium przypadku jest również opis wyzwań technicznych związanych z wykorzystaniem technologii takich jak JavaScript, XML, JSON czy AJAX/J podczas tworzenia stron WWW. Z decyzją o wykorzystywaniu usługi Archive-It wiązała się także możliwość wykorzystywania aplikacji Umbra, rozwijanej właśnie z myślą o tego typu wyzwaniach. Według bibliotekarzy rozwiązanie to świetnie sprawdziło się w pracy z zasobami mediów społecznościowych (np. Facebooka i Twittera), okazało się jednak mało skuteczne przy niewielkich stronach internetowych, w których zawartość generowana jest w sposób dynamiczny z wykorzystaniem zapytań JavaScript do baz danych. Efektem tych problemów było podjęcie prac nad stworzeniem własnego programu, dostosowanego do potrzeb tworzonej kolekcji.

Pomimo opisanych wyzwań prace związane z archiwizacją Webu stały się ważną częścią działalności biblioteki. Kontynuowana jest zarówno praca nad nowymi kolekcjami, jak działania organizacyjno-techniczne, mające na celu usprawnienie całego procesu archiwizacji stron WWW.

Davis, C., Archiving the Web: A Case Study from the University of Victoria, Code{4}lib Journal, Issue 26, 2014-10-21: https://journal.code4lib.org/articles/10015

Treść dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 4.0 Blog naukowy, publikacje i materiały edukacyjne pracowni w 2018 roku powstały w ramach projektu Upowszechnianie wiedzy o archiwizacji Webu i metodach korzystania z historycznych zasobów WWW w instytucjach publicznych i sektorze NGO, prowadzonego przez Stowarzyszenie EBIB i finansowanego przez MNISW w programie Działalność Upowszechniająca Naukę (DUN).