Wykorzystanie archiwów Webu w mediach społecznościowych

Pisaliśmy już na tym blogu o alternatywnych zastosowaniach archiwów Webu do upowszechniania propagandy terrorystycznej. Tymczasem Savvas Zannettou ze współpracownikami przeprowadzili analizę obecności zasobów archiwów Webu w takich serwisach jak Reddit, Twitter, Gab i 4Chan, aby sprawdzić inne pozanaukowe zastosowania archiwów takich jak archive.is i Wayback Machine. Autorzy przeanalizowali dwuletni indeks live feed adresów URL zabezpieczanych w archive.is (21 mln) oraz obecność linków z domen archive.is i archive.org/web (747 tys.) udostępnianych w treściach postów wybranych serwisów.

Najważniejsze wnioski z analizy:

  • najczęściej archiwizowanym typem treści webowych są strony newsowe i posty w mediach społecznościowych;
  • kopie stron wygenerowane w archiwach Webu udostępniane są w badanych mediach społecznościowych 1) ze względu na nietrwałość ich oryginalnych wersji (często szybko usuwanych ze względu na kontrowersyjny lub nielegalny charakter), 2) w celu uniknięcia zwiększania ruchu na oryginalnej domenie;
  • publikowanie kopii strony w archive.is lub Wayback Machine bywa sposobem na ominięcie automatycznej cenzury linków, jaką stosują niektóre serwisy społecznościowe wobec wybranych domen;
  • za 44 proc. linków kierujących do Wayback Machine i 85 proc. kierujących do Archive.is w postach publikowanych na Reddicie odpowiadają boty, automatycznie generujące kopie linków wstawianych przez użytkowników;
  • publikowanie kopii stron z portali newsowych w archiwach Webu bywa metodą walki z ideologicznym przeciwnikiem: kopia umieszczona w Wayback Machine czy Archive.is nie generuje wydawcy odsłon i nie przekłada się na zyski z reklam. Autorzy opracowania szacują, że serwisy publikowane przez tytuły prasowe jak Washington Post mogą dzięki temu tracić około 70 tys. dolarów rocznie.

Omawiany artykuł udowadnia, że archiwa Webu nie są jedynie statycznym repozytorium historycznych kopii witryn, ale narzędziem wykorzystywanym w bieżącej komunikacji online, nawet jako forma oporu wobec wybranych nadawców czy przyjętych przez platformy społecznościowe zasad moderacji.

Zannettou, S., Blackburn, J., De Cristofaro, E., Sirivianos, M., & Stringhini, G. (2018). Understanding Web Archiving Services and Their (Mis) Use on Social Media. arXiv preprint arXiv:1801.10396.

Treść dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 4.0 Blog naukowy, publikacje i materiały edukacyjne pracowni w 2018 roku powstały w ramach projektu Upowszechnianie wiedzy o archiwizacji Webu i metodach korzystania z historycznych zasobów WWW w instytucjach publicznych i sektorze NGO, prowadzonego przez Stowarzyszenie EBIB i finansowanego przez MNISW w programie Działalność Upowszechniająca Naukę (DUN).