Czy zawartość archiwów Webu jest bezpieczna dla użytkowników?

Ada Lerner, Tadayoshi Kohno i Franziska Roesner rozpoznali i przeanalizowali słabe punkty w sposobach archiwizowania danych w Wayback Machine. Badacze zdecydowali się na przeprowadzenie swojego eksperymentu na zbiorach Wayback Machine przede wszystkim dlatego, że jest to największe i najpopularniejsze z istniejących archiwów Webu. Co więcej, wiele mniejszych archiwów internetu opiera się na oprogramowaniu i rozwiązaniach wypracowanych przez Wayback Machine.W związku z tym zakończone powodzeniem ataki na zasoby Wayback Machine mogłyby być z łatwością zreplikowane w przypadku innych archiwów.

Podczas eksperymentu najpierw zidentyfikowano listę najważniejszych niedociągnięć serwisu, a następnie sprawdzono, czy możliwe jest wykorzystanie ich i tym samym wywarcie wpływu na archiwalną stronę internetową. Według badaczy w strukturze Wayback Machine wskazać można trzy podstawowe kategorie słabych punktów:

  • Związane z opuszczeniem archiwum – chociaż użytkownik przekonany jest, że wybrany przez niego link prowadzi do archiwalnego obrazu strony internetowej, to tak naprawdę opuszcza archiwum i ogląda standardową zawartość webową;
  • związane z wykorzystaniem elementu <iframe> – w archiwach webu wszystkie elementy, składające się na widok strony, ładowane są z jednej domeny. Możliwe jest więc wpłynięcie na zewnętrzne elementy strony (takie jak np. reklamy) i wyświetlenie w ich miejsce alternatywnej zawartości;
  • związane z niekompletnością archiwum – chociaż Wayback Machine jest największym archiwum Webu, to wciąż nie obejmuje wszystkich istniejących stron internetowych we wszystkich momentach ich egzystencji. W sytuacji, w której użytkownik usiłuje obejrzeć widok danej strony z konkretnego momentu w czasie, Wayback Machine wyświetla najbliższy tej dacie posiadany obraz – nawet, jeśli w zapytaniu pojawia się widok strony z 1996 roku, a w zbiorach dostępny jest tylko obraz z 2016 roku.

Następnie badacze przeprowadzili serię ataków na zbiory Wayback Machine udowadniając, że możliwe jest wywarcie stałego i globalnego (widocznego dla wszystkich użytkowników) wpływu na zbiory archiwów Internetu. Po zakończeniu eksperymentu skutki wszystkich ataków zostały usunięte, a zbiory Wayback Machine powróciły do swojego pierwotnego kształtu. Badacze zaproponowali kilka rozwiązań, które mogłyby zwiększyć bezpieczeństwo archiwizowanych zbiorów – jednym z nich jest zaprojektowana i zbudowana w ramach tego samego eksperymentu aplikacja ArchiveWatcher.

Ada Lerner, Tadayoshi Kohno, and Franziska Roesner, „Rewriting History: Changing the Archived Web from the Present”. Presented at ACM Conference on Computer and Communications Security (CCS). Dallas, Texas, USA, October 30, 2017 to November 3, 2017: https://repository.wellesley.edu/cgi/viewcontent.cgi?article=1158&context=scholarship

Treść dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 4.0 Blog naukowy, publikacje i materiały edukacyjne pracowni w 2018 roku powstały w ramach projektu Upowszechnianie wiedzy o archiwizacji Webu i metodach korzystania z historycznych zasobów WWW w instytucjach publicznych i sektorze NGO, prowadzonego przez Stowarzyszenie EBIB i finansowanego przez MNISW w programie Działalność Upowszechniająca Naukę (DUN).