Metadane opisowe do archiwizacji Webu – raport Web Archiving Metadata Working Group

Jednym z najczęściej zgłaszanych problemów przez użytkowników oraz pracowników archiwów Webu jest brak odpowiedniego podejścia do metadanych opisowych, które pozwoliłyby lepiej zrozumieć kontekst gromadzonych zasobów i ułatwiły ich późniejsze wykorzystanie przez badaczy. Zagadnienie to zostało podjęte przez działającą od 2015 r. przy OCLC Research Library Partnership grupę roboczą Web Archiving Metadata (WAM). Wyniki jej pracy zostały przedstawione w trzech raportach, jeden z nich zawiera propozycję zestawu metadanych, które zdaniem jego autorów wydają się być odpowiednie do opisywania zbiorów archiwalnych witryn WWW.

Prace WAM rozpoczęły się od analizy literatury naukowej, która pozwoliła poznać oczekiwania względem opisu tego rodzaju materiałów zgłaszane przez pracowników zajmujących się nimi, a także osób z nich korzystających. Kolejnym krokiem było zapoznanie się z narzędziami do archiwizowania zasobów sieciowych i sposobie generowania przez nie metadanych. Autorzy raportu przyjrzeli się także standardom opisu i wytycznym wykorzystywanym przez archiwa, biblioteki i inne instytucje prowadzące taką działalność.

Efektem badań prowadzonych w ramach WAM jest zestaw 14 metadanych, który może być skutecznie wykorzystywany zarówno do opisywania pojedynczych archiwalnych witryn, a także całych ich zbiorów. Zdaniem autorów raportu mają one łączyć doświadczenia archiwistów oraz bibliotekarzy i służyć mają zarówno badaczom gromadzącym takie zasoby na własne potrzeby, jak i poszczególnym instytucjom prowadzącym projekty archiwizacji Webu. Na zaproponowany zestaw metadanych składają się:

Zbieracz [collector] instytucja odpowiedzialna za gromadzenie i zarządzanie archiwalnymi witrynami lub ich zbiorami
Współpracownik [contributor] osoba lub organizacja wtórnie odpowiedzialna za zawartość witryny lub zbioru witryn
Twórca [creator] osoba lub organizacja głównie odpowiedzialna za tworzenie zawartości witryny lub zbioru witryn
Data [date] data lub zakres dat związany z cyklem funkcjonowania witryny lub zbioru witryn
Opis [description] krótki opis zawartości, kontekstu i innych aspektów funkcjonowania witryny lub zbioru witryn
Rozmiar [extent] wskazanie rozmiaru (ilość witryn, megabajtów etc.) witryny lub zbioru witryn
Rodzaj/forma [genre/form] określenie rodzaju zawartości witryny lub zbioru witryn
Język [language] język zawartości witryny lub zbioru witryn
Relacje [relation] wskazanie relacji witryny z częścią lub całością zbiorów do których należy
Prawa [rights] określenie uprawnień związanych z prawem autorskim i innymi przepisami
Źródła opisu [source of description] informacja o źródłach wykorzystanych do opracowania opisu witryny lub zbioru witryn
Temat [subject] najważniejszy przedmiot treści witryny lub zbioru witryn
Tytuł [title] nazwa witryny lub zbioru witryn
URL internetowy adres witryny lub zbioru witryn
Dooley, J. & Bowers, K., Descriptive Metadata for Web Archiving: Recommendations of the OCLC Research Library Partnership Web Archiving Metadata Working Group, Dublin 2018, https://doi:10.25333/C3005C

Treść dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 4.0 Blog naukowy, publikacje i materiały edukacyjne pracowni w 2018 roku powstały w ramach projektu Upowszechnianie wiedzy o archiwizacji Webu i metodach korzystania z historycznych zasobów WWW w instytucjach publicznych i sektorze NGO, prowadzonego przez Stowarzyszenie EBIB i finansowanego przez MNISW w programie Działalność Upowszechniająca Naukę (DUN).