Sprawa Joy Reid i ograniczenia archiwów WWW

Joy Reid to znana amerykańska dziennikarka kojarzona z Partią Demokratyczną i związana ze stacją MSNBC. Pod koniec 2017 i na początku 2018 roku w Internecie pojawiły się linki do postów z jej bloga oraz kont w mediach społecznościowych, w których opublikowano homofobiczne oraz obraźliwe sformułowania. Zarówno blog, jak i wspomniane posty zostały wcześniej usunięte z Internetu, wszystkie linki prowadzą więc do zawartości dostępnej poprzez Wayback Machine oraz do zrzutów ekranu.

Ostatecznie dziennikarka przeprosiła za używanie obraźliwych sformułowań, twierdząc jednak, że wiele z nich nie zostało przez nią nigdy napisanych i że padła ofiarą hakerów. W Stanach Zjednoczonych sprawa ta odbiła się dość głośnym echem i była komentowana nie tylko przez dziennikarzy, ale też przez ekspertów zajmujących się zarówno cyberbezpieczeństwem, jak i archiwizacją stron WWW.

W przypadku Joy Reid część prezentowanych wypowiedzi dokumentowana była za pomocą screenshotów. Eksperci podkreślają, że zrzut ekranu ma raczej niską wartość dowodową – to tylko obrazek, bardzo podatny na wszelkiego rodzaju manipulacje. W tej konkretnej sprawie wątpliwości budziły linki – nie było widać żadnego kompletnego linku do postów, w których pojawiała się homofobiczna i obraźliwa zawartość. W większości przypadków trudno było także odtworzyć datę konkretnego postu.

Ciekawym wątkiem w sprawie okazała się możliwość korzystania z uzupełniających się archiwów Webu. Poza zagrożeniami związanymi z atakami na zawartość konkretnych archiwów (pisaliśmy o tym w tej notce) czasami istnieje także możliwość samodzielnego usunięcia czy redagowania dostępnej w archiwum zawartości. W przypadku Internet Archive wystarczy do tego wykorzystanie pliku robots.txt. W tym wypadku jest to o tyle istotne, że po pierwszych oskarżeniach usunięto bloga dziennikarki z zasobów Internet Archive, jego kopie pozostały jednak zbiorach Biblioteki Kongresu. Szybko zostały one wykorzystane jako dowód na brak jakiegokolwiek ataku hakerskiego na redagowaną przez dziennikarkę stronę.

Prawnicy dziennikarki wielokrotnie podkreślali, że prezentowana zawartość archiwalna nie może być prawdziwa, ponieważ pod tak kontrowersyjnymi wypowiedziami nie pojawiają się żadne komentarze. Również w tym wypadku eksperci podkreślają jednak, że więcej mówi to o metodach archiwizacji Webu niż o faktycznej reakcji społecznej na opublikowane treści. W przypadku omawianego bloga cała zawartość dostępna była w pliku HTML, jednak komentarze wyświetlano poprzez JavaScript, jednak zawartość wyświetlana przez JavaScript zarchiwizowana została dopiero miesiąc później. Nie sposób więc stwierdzić, czy i jakie komentarze w ogóle nie zostały uwzględnione w archiwum.

Według ekspertów archiwalne materiały nie dowodzą, że Joy Reid padła ofiarą ataku hakerskiego. Od sprawy odcięły się także archiwa – Internet Archive oficjalnie wykluczyło w tym wypadku możliwość manipulacji na swoich zasobach. Sytuacja ta pozostaje jednak ciekawym przykładem wykorzystania zasobów archiwalnych w aktualnej debacie, dowodząc przy okazji, z jak wielką ostrożnością powinny być traktowane tego typu zbiory.

Nelson, M. L., The Internet Archive Can’t Preserve the Web’s History by Itself, Motherboard 30.04.2018: https://motherboard.vice.com/en_us/article/7xdn8y/joy-reid-and-the-weaponization-of-internet-archives

Treść dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 4.0 Blog naukowy, publikacje i materiały edukacyjne pracowni w 2018 roku powstały w ramach projektu Upowszechnianie wiedzy o archiwizacji Webu i metodach korzystania z historycznych zasobów WWW w instytucjach publicznych i sektorze NGO, prowadzonego przez Stowarzyszenie EBIB i finansowanego przez MNISW w programie Działalność Upowszechniająca Naukę (DUN).