Studium przypadku: archiwizacja Webu na University of Victoria
Archiwizacja stron WWW jest na University of Victoria prowadzona od 2013 roku. Instytucją odpowiedzialną za projekt archiwizacyjny jest biblioteka uniwersytecka. Ściśle związane jest to z charakterem kolekcji, która traktowana jest jako logiczne rozwinięcie zbiorów gromadzonych przez instytucję.
Według bibliotekarzy takie ujęcie pozwala także na wypełnienie ważnej luki. Największe Archiwum Webu (mowa tu rzecz jasna o zbiorach gromadzonych przez fundację Internet Archive) ma bardzo ogólny profil, natomiast narodowe archiwa koncentrują się na zabezpieczaniu oficjalnych stron rządowych lub domeny krajowej. Zbiór z University of Victoria traktowany był od początku jako uzupełnienie, swego rodzaju trzecia droga, koncentrująca się na zbiorach o walorach kulturowych.
Podjęcie decyzji dotyczącej szczegółowego profilu zbiorów zajęło jednak aż osiem miesięcy. W końcu zdecydowano się na następujące zasoby:
- strony WWW związane z obchodami pięćdziesięciolecia Uniwersytetu;
- specjalne kolekcje tematyczne, będą rozwinięciem istniejących kolekcji dotyczących zagadnień związanych z anarchizmem, transgenderyzmem, lokalnością i działaniem organizacji walczących o środowisko;
- strony WWW lokalnego rządu;
- strony WWW związane z cyfrową humanistyką.
Co ciekawe, w pierwszej kolejności podjęto decyzje dotyczące kwestii technicznych – zdecydowano się na wykupienie subskrypcji i korzystanie z usług Archive-It jeszcze zanim zainicjowano dyskusję na temat szczegółowego charakteru kolekcji.
Bardzo szybko okazało się także, że zabezpieczenie tego typu zbiorów wiąże się z wieloma trudnościami organizacyjnymi, szczególnie odczuwanymi właśnie przez biblioteki. Instytucje te często odpowiedzialne są za katalogowanie historycznych zbiorów WWW, sam system działania więcej ma jednak wspólnego z tworzeniem zbiorów archiwalnych niż bibliotecznych. Prace bardzo ułatwiło więc włączenie w nie osób związanych z uniwersyteckimi archiwami.
Kolejnym wyzwaniem okazało się kwestie prawnoautorskie – brak ogólnoprzyjętych rozwiązań i niejasny status prawny tego typu zbiorów sprawił, że kolejne kolekcje udostępniane są stopniowo. Naczelną zasadą dla pracowników tworzących archiwum jest bowiem pełne wyjaśnienie kwestii prawnych dotyczących każdego z udostępnianych obiektów.
Ciekawą częścią omawianego studium przypadku jest również opis wyzwań technicznych związanych z wykorzystaniem technologii takich jak JavaScript, XML, JSON czy AJAX/J podczas tworzenia stron WWW. Z decyzją o wykorzystywaniu usługi Archive-It wiązała się także możliwość wykorzystywania aplikacji Umbra, rozwijanej właśnie z myślą o tego typu wyzwaniach. Według bibliotekarzy rozwiązanie to świetnie sprawdziło się w pracy z zasobami mediów społecznościowych (np. Facebooka i Twittera), okazało się jednak mało skuteczne przy niewielkich stronach internetowych, w których zawartość generowana jest w sposób dynamiczny z wykorzystaniem zapytań JavaScript do baz danych. Efektem tych problemów było podjęcie prac nad stworzeniem własnego programu, dostosowanego do potrzeb tworzonej kolekcji.
Pomimo opisanych wyzwań prace związane z archiwizacją Webu stały się ważną częścią działalności biblioteki. Kontynuowana jest zarówno praca nad nowymi kolekcjami, jak działania organizacyjno-techniczne, mające na celu usprawnienie całego procesu archiwizacji stron WWW.