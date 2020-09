Wayback Machine è un importante archivio digitale lanciato nel 2001 dall’Internet Archive (Archive.org), organizzazione no profit con sede a San Francisco. Il sito si occupa di un particolare problema: la necessità di archiviare contenuti di siti web, facendo in modo che questi siano sempre disponibile, anche dopo modifica o la loro chiusura (una sorta di emeroteca del web che consente di recuperare anche informazioni scomparse perché – banalmente – non è stato ad esempio rinnovato l’acquissto del dominio). È un lavoro immenso ma importante perché consente di ottenere versioni archiviate di numerose pagine Web nel corso del tempo, una sorta di “macchina del tempo” dalla quale richiamare copie permanenti di pagine web modificate o eliminate.

Come è facile immaginare, memorizzare “snapshot” (istantanee) di tantissimi siti web, richiede grandi quantità di spazio di archiviazione (nel solo 2009 si calcola che Wayback Machine cresceva al ritmo di 100 terabyte al mese); dati del 2018 riferiscono di oltre 25 petabyte di dati archiviati.

Internet Archive ha ora avviato una partnership con Cloudflare e gli archivi in questione sono accessibili anche da URL che sfruttano la funzionalità “Always Online” di Cloudflare che permette di servire automaticamente una pagina statica (dalla sua cache) in caso di down del server originale, in modo tale che l’utente non si accorga del problema.

Wayback Machine vanta oltre 486 miliardi di pagine web archiviate e circa 1 miliardo di URL scandagliati ogni giorno. L’accordo con Cloudflare per i suoi servizi di caching reverse proxy potrebbe portare all’ulteriore espansione di funzionalità e siti scandagliati e archiviati.

“Wayback Machine di Internet Archive dispone di un’imponente infrastruttura in grado di archiviare il web su larga scala”, riferisce Matthew Prince, co-fondatore e CEO of Cloudflare. “Lavorando insieme possiamo fare un altro passo per rendere internet più resiliente, impedendo il verificarsi di problemi dei server per i nostri clienti e di conseguenza interrompendo aziende e utenti online”.