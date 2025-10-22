Il 22 ottobre il progetto Wayback Machine celebra mille miliardi di pagine web archiviate. Si tratta, lo ricordiamo, di un immenso archivio digitale, una vera e propria memoria storica del World Wide Web, un progetto lanciato ufficialmente nel 2001 da Internet Archive, organizzazione no profit con sede a San Francisco.

Il traguardo è riportato sul blog di Internet Archive spiegando che per l’occasione è previsto un party nel quartier generale di San Francisco e un evento in livestreaming con amici e supporter di tutto il mondo. “Più che una celebrazione, è un tributo a ciò che abbiamo costruito insieme: una biblioteca digitale del web libera e aperta”, si legge sul blog dell’organizzazione.

L’ida di creare un archivio storico del web nacque per affrontare il problema della scomparsa dei contenuti di un sito web ogni volta che viene modificato o chiuso. Il servizio consente di visualizzare versioni archiviate delle pagine Web di un sito nel tempo, quello l’archivio definisce un “indice tridimensionale”. L’idea dei fondatori, Kahle e Bruce Gillia, è stata quella di creare una sorta di macchina del tempo con l’obiettivo di archiviare l’intera Internet e fornire “accesso universale a tutte le conoscenze”.

Wayback Machine ha iniziato ad archiviare le pagine Web memorizzate nella cache nel 1996, con l’obiettivo di rendere pubblico il servizio cinque anni dopo. Quando l’archivio ha raggiunto il suo quinto anniversario nel 2001, è stato presentato e aperto al pubblico con una cerimonia presso l’Università della California – Berkeley; Al momento del lancio di Wayback Machine, conteneva già oltre 10 miliardi di pagine archiviate.

Archivio immenso

Dal punto di vista tecnico il sistema scandaglia il web scaricando tutte le pagine del World Wide Web accessibili al pubblico (e informazioni raccolte di “crawler” non includono tutte le informazioni disponibili, giacché gran parte dei dati è in alcuni casi limitata dall’editore o archiviata in database non accessibili). A dicembre 2020 i dati di Wayback Machine comprendevano oltre 70 petabyte di dati.