Diffengine – narzędzie do śledzenia zmian w treści newsów publikowanych online
Diffengine (skrót od difference engine) to oprogramowanie stworzone w ramach projektu „Documenting the Now” (DocNow) przez Maryland Institute for Technology in the Humanities. Narzędzie to służy do śledzenia zmian w publikowanych on-line treściach (głównie newsach czy wpisach blogowych) dzięki wykorzystaniu kanałów RSS.
Zasada działania diffengine jest prosta: program subskrybuje wybrane kanały RSS i automatycznie wyłapuje oraz dokumentuje zmiany w publikowanych w nich treściach (tworzy tzw. diff – zapis powstałych różnic). Jeśli komunikowany przez RSS artykuł zostaje edytowany i już po edycji zostaje ponownie wysłany kanałem RSS w zmienionej wersji, program wysyła jego URL do zarchiwizowania w Wayback Machine oraz publikuje na Twitterze informację o zmianie.
Treści publikowane on-line, w przeciwieństwie do tych w papierowej wersji, są dynamiczne i często zmieniają się z czasem, jednak informacja o tych zmianach nie zawsze jest łatwo dostępna dla odbiorców. Mniej lub bardziej poważne zmiany w zawartości informacji mogą być spowodowane nie tylko chęcią ich uaktualnienia czy poprawienia po zauważeniu błędów. Negatywne reakcje opinii publicznej, bezpośrednie interwencje polityczne czy grup interesu albo autocenzura również mogą być przyczyną wprowadzania zmian.
Malaysia’s Mahathir Mohamad on course to be world’s oldest elected leader – BBC News https://t.co/r9nPx640ty ➜ https://t.co/svuOUNKZ2c pic.twitter.com/QNCp4SGmDJ
— Editing the BBC (@bbc_diff) 10 maja 2018
Jakie może więc być zastosowanie Diffengine? Z jednej strony codzienne: użytkownik może obserwować zmiany w szczególnie interesujących go treściach online. Z drugiej strony naukowe i archwistyczne: narzędzie może pomóc np. w zrozumieniu, jak powstają newsy i fake newsy lub jak wydawcy informacji reagują na naciski opinii publicznej lub polityków. Diffengine umożliwia zbudowanie rejestru zmian w treści wybranych URLI, a kopie zarchiwizowane w Internet Archive pozwalają łatwe podglądanie i porównywanie zmian.
Przykładowe konta na Tweeterze publikujące diffy z newsów najważniejszych wydawców to:
- wapo_diff (Washington Post)
- guardian_diff (The Guardian)
- bbc_diff (BBC)
- cbc_diff (Canadian Broadcasting Corporation)
- cnn_diff (CNN)
- dailymail_diff (Daily Mail)
- fox_diff (Fox News)
- lapresse_diff (La Presse)
- repubblica_diff (La Repubblica)
- reuters_diff (Reuters)
- telegraph_diff (The Telegraph)
- wsj_diff (Wall Street Journal)
Diffengine to program działający w Pythonie. Aby umożliwić rejestrowanie zmian na bieżąco, po konfiguracji programu należy ustawić cron job (harmonogram wymuszający jego uruchamianie z określoną częstotliwością). Szczegółowy opis konfiguracji dostępny jest na GitHubie.