Metadane opisowe do archiwizacji Webu – raport Web Archiving Metadata Working Group
Jednym z najczęściej zgłaszanych problemów przez użytkowników oraz pracowników archiwów Webu jest brak odpowiedniego podejścia do metadanych opisowych, które pozwoliłyby lepiej zrozumieć kontekst gromadzonych zasobów i ułatwiły ich późniejsze wykorzystanie przez badaczy. Zagadnienie to zostało podjęte przez działającą od 2015 r. przy OCLC Research Library Partnership grupę roboczą Web Archiving Metadata (WAM). Wyniki jej pracy zostały przedstawione w trzech raportach, jeden z nich zawiera propozycję zestawu metadanych, które zdaniem jego autorów wydają się być odpowiednie do opisywania zbiorów archiwalnych witryn WWW.
Prace WAM rozpoczęły się od analizy literatury naukowej, która pozwoliła poznać oczekiwania względem opisu tego rodzaju materiałów zgłaszane przez pracowników zajmujących się nimi, a także osób z nich korzystających. Kolejnym krokiem było zapoznanie się z narzędziami do archiwizowania zasobów sieciowych i sposobie generowania przez nie metadanych. Autorzy raportu przyjrzeli się także standardom opisu i wytycznym wykorzystywanym przez archiwa, biblioteki i inne instytucje prowadzące taką działalność.
Efektem badań prowadzonych w ramach WAM jest zestaw 14 metadanych, który może być skutecznie wykorzystywany zarówno do opisywania pojedynczych archiwalnych witryn, a także całych ich zbiorów. Zdaniem autorów raportu mają one łączyć doświadczenia archiwistów oraz bibliotekarzy i służyć mają zarówno badaczom gromadzącym takie zasoby na własne potrzeby, jak i poszczególnym instytucjom prowadzącym projekty archiwizacji Webu. Na zaproponowany zestaw metadanych składają się:
Zbieracz [collector] | instytucja odpowiedzialna za gromadzenie i zarządzanie archiwalnymi witrynami lub ich zbiorami |
Współpracownik [contributor] | osoba lub organizacja wtórnie odpowiedzialna za zawartość witryny lub zbioru witryn |
Twórca [creator] | osoba lub organizacja głównie odpowiedzialna za tworzenie zawartości witryny lub zbioru witryn |
Data [date] | data lub zakres dat związany z cyklem funkcjonowania witryny lub zbioru witryn |
Opis [description] | krótki opis zawartości, kontekstu i innych aspektów funkcjonowania witryny lub zbioru witryn |
Rozmiar [extent] | wskazanie rozmiaru (ilość witryn, megabajtów etc.) witryny lub zbioru witryn |
Rodzaj/forma [genre/form] | określenie rodzaju zawartości witryny lub zbioru witryn |
Język [language] | język zawartości witryny lub zbioru witryn |
Relacje [relation] | wskazanie relacji witryny z częścią lub całością zbiorów do których należy |
Prawa [rights] | określenie uprawnień związanych z prawem autorskim i innymi przepisami |
Źródła opisu [source of description] | informacja o źródłach wykorzystanych do opracowania opisu witryny lub zbioru witryn |
Temat [subject] | najważniejszy przedmiot treści witryny lub zbioru witryn |
Tytuł [title] | nazwa witryny lub zbioru witryn |
URL | internetowy adres witryny lub zbioru witryn |