ArchiveWeb – narzędzie do współpracy z wykorzystaniem archiwalnych zasobów Webu

Wciąż istnieje potrzeba rozwijania narzędzi umożliwiających wykorzystanie archiwów Webu w pracy naukowców, dziennikarzy oraz innych osób zainteresowanych ich kreatywnym wykorzystaniem.

Platforma ArchiveWeb to projekt Zeona T. Fernando, Ivany Marenzi i Wolfganga Nejdla (Uniwersytet Gottfrieda Wilhelma Leibniza w Hanowerze), mający za zadanie umożliwić badaczom wspólne eksplorowanie, porządkowanie i badanie archiwalnych witryn WWW. Na etapie projektowania autorzy przeprowadzili konsultacje z archiwistami webowymi, kuratorami oraz bibliotekarzami prowadzącymi kolekcję archiwalnych witryn, co pozwoliło przygotować narzędzie posiadające funkcje niezbędne podczas pracy naukowej z tego rodzaju zasobów. Na początku funkcjonowania projektu zaimportowano do niego 200 kolekcji pochodzących z Archive-It i zaczęto przygotowywać rozwiązanie umożliwiające grupom badaczy prowadzenie współpracy.

Twórcy platformy przygotowali specjalne narzędzie wyszukiwawcze, za pomocą którego możliwe jest przeszukiwanie kolekcji archiwalnych witryn internetowych pochodzące z Archive-It oraz te stworzone przez użytkowników ArchiveWeb. Dzięki wykorzystaniu API udostępnionego przez BING jednocześnie przeszukiwana jest również żywa Sieć, w tym także grafiki oraz wideo. Wyszukiwarka została zaopatrzona w szereg filtrów, które pozwalają odpowiednio zawęzić listę wyników.

Przeglądanie kolekcji archiwalnych witryn WWW w aplikacji ArchiveWeb

Inną funkcjonalnością jest budowanie kolekcji archiwalnych witryn oraz modyfikowanie już istniejących. Użytkownicy serwisu mogą przenosić poszczególne obiekty pomiędzy poszczególnymi kolekcjami, tworzyć podgrupy oraz opisywać wszystko odpowiednimi metadanymi oraz adnotacjami, które ułatwiają ich wykorzystanie oraz późniejszą współpracę w zespole. Możliwe jest również wskazanie witryn z pochodzących z „bieżącego” Internetu do archiwizacji i włączenie ich do odpowiednich zbiorów.

Po dwóch latach funkcjonowania platformy ArchiveWeb przeprowadzono jego ewaluację z udziałem ekspertów, którzy byli zaangażowani w proces jego projektowania. Przeprowadzono testy w trakcie pracy indywidualnej oraz grupowej. Zgromadzone w ich trakcie dane z logów oraz reakcje uczestników wskazały kierunki rozwoju dla omawianego projektu, wśród których pojawiło się m.in. wyszukiwanie pełnotekstowe oraz opcje manipulowania całymi zbiorami archiwalnych witryn. Powstawanie i rozwój tego rodzaju narzędzi jest konieczne, ponieważ skutecznie może przyczynić się do częstszego wykorzystania zasobów archiwów webowych, które czekają na zainteresowanie badaczy.

Fernando, Z. T., Marenzi, I., & Nejdl, W. (2018). ArchiveWeb: collaboratively extending and exploring web archive collections—How would you like to work with your collections? International Journal on Digital Libraries, 19(1), 39-55., https://doi.org/10.1007/s00799-016-0206-2

Treść dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 4.0 Blog naukowy, publikacje i materiały edukacyjne pracowni w 2018 roku powstały w ramach projektu Upowszechnianie wiedzy o archiwizacji Webu i metodach korzystania z historycznych zasobów WWW w instytucjach publicznych i sektorze NGO, prowadzonego przez Stowarzyszenie EBIB i finansowanego przez MNISW w programie Działalność Upowszechniająca Naukę (DUN).