Archiwizacja Webu w Chorwacji – Hrvatski arhiv weba

Autor Bartłomiej Konopa Opublikowano 12 września 2018 Projekty, Publikacje

Podejmowanie się gromadzenia i zabezpieczenia zasobów Webu przez biblioteki narodowe lub inne powołane w tym celu instytucje jest dość częstą praktyką. Metody i narzędzia stosowane przez narodowe archiwa Webu są bardzo różnorodne i zależą od lokalnych możliwości i potrzeb. Warto wiedzieć, że archiwa Webu powstają nie tylko w krajach Zachodu (takich jak Wielka Brytania, Francja czy Australia). Narodowa i Uniwersytecka Biblioteka w Zagrzebiu (NUL), we współpracy z Centrum Komputerowym Uniwersytetu w Zagrzebiu, w 2004 r. powołała do życia Digitalni arhiv mrežnih publikacija (Cyfrowe archiwum publikacji sieciowych). W roku 2010 zmieniło ono nazwę na Hrvatski arhiv weba (HAW, Chorwackie Archiwum Webu) oraz rozszerzyło swoją działalność.

NUL, na podstawie przepisów prawnych związanych z egzemplarzem obowiązkowym wprowadzonych w 1997 r., miała prawo do gromadzenia publikacji dostępnych online. Ze względu na warunki techniczne i finansowe podjęto się najpierw katalogowania tego rodzaju materiałów i rozpoczęto je w 1998 roku. Powodem holistycznego archiwizowania chorwackiego Webu był fakt, iż duża część zebranych adresów URL stała się nieaktywna i utracono w ten sposób część narodowego cyfrowego dziedzictwa. W pierwszym okresie archiwizacji, w latach 2004-2010, ze względu na ograniczone możliwości NUL, witryny były gromadzone w sposób selektywny. Głównymi kryteriami wykorzystywanym przez bibliotekarzy były: autor chorwackiego pochodzenia, publikacja w Chorwacji lub w języku chorwackim, a także powiązanie tematyczne z tym krajem oraz jego obywatelami. Stosowano także dodatkowe kryteria: zawartości, wydawcy lub autora, struktury, domeny, formatu oraz unikatowości. Po zmianie nazwy w 2010 w HAW przeprowadzono pierwszą archiwizację całej chorwackiej domeny narodowej (.hr) i powtarza się ją obecnie raz do roku. Dodatkowo budowane są kolekcje tematyczne, z których większość dotyczy wyborów, ale można tam znaleźć zbiór także dotyczący powodzi, która miała miejsce w 2014 r.

HAW w archiwizacji selektywnej wykorzystuje własne oprogramowanie, natomiast przy gromadzeniu domeny .hr oraz kolekcji tematycznych działa w oparciu o Wayback Machine oraz crawlera Heritrix. Wszystkie zgromadzone zasoby są udostępniane publicznie poprzez witrynę archiwum. Obiekty zgromadzone podczas archiwizacji domeny są przeszukiwalne wyłącznie za pomocą pełnego adresu URL, natomiast te gromadzone selektywnie posiadają wyszukiwarkę wykorzystującą słowa kluczowe oraz katalogi tematyczny i alfabetyczny.

Strona główna HAW (wersja angielska) – http://haw.nsk.hr/en

Holub, K., Rudomino, I., A decade of web archiving in the National and University Library in Zagreb, IFLA WLIC 2015, http://library.ifla.org/1092/1/090-holub-en.pdf

Treść dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 4.0 Blog naukowy, publikacje i materiały edukacyjne pracowni w 2018 roku powstały w ramach projektu Upowszechnianie wiedzy o archiwizacji Webu i metodach korzystania z historycznych zasobów WWW w instytucjach publicznych i sektorze NGO, prowadzonego przez Stowarzyszenie EBIB i finansowanego przez MNISW w programie Działalność Upowszechniająca Naukę (DUN).