World Wide Web to rozwijana od początków lat 90. jedna z warstw internetu, wykorzystywana do publikowania zasobów i aplikacji, powiązanych ze sobą za pomocą hiperłączy (linków) i identyfikowanych przez adresy URL.
Każdy obiekt (zasób) publikowany w WWW, indetyfikowany jest adresem URL. Zasoby WWW funkcjonują w sieci, są też od siebie zależne. Przykładowo, jedna strona WWW zbudowana być może z setek elementów, takich jak pliki graficzne, kody CSS, skrypty JavaScript, ale też pliki multimedialne, binarne, wykonywalne itp. Podstawową strukturę każdej strony określa kod w języku HTML.
Chociaż istnieją fundamentalne różnice między znaczeniem pojęć “internet” i WWW (Web), współcześnie utożsamia się je ze sobą. Stąd mowa o “archiwizacji internetu”, która zazwyczaj polega na archiwizowaniu zasobów WWW (zdecydowanie mniejszy zakres mają starania o archiwizację poczty elektronicznej czy zasobów FTP).
Sieciowy i rozproszony charakter zasobów WWW powoduje, że ich skuteczna archiwizacja bywa trudna. Wyzwaniem jest też stabilność adresów URL, identyfikujących te zasoby. Także współczesne metody tworzenia stron i aplikacji webowych mogą utrudniać archiwizację, np. poprzez personalizację treści dostępnych pod tym samym adresem albo wersjonowanie treści pod urządzenia, na których są one wyświetlane.
Sieć WWW sama w sobie nie posiada żadnych mechanizmów autoarchiwizacji, inaczej niż w nowoczesnych projektach sieci P2P, np. IPFS.