Esiste tutto un mondo di documenti non ricercabili. Sono quelli scansionati dagli originali cartacei e mai acquisiti con i normali sistemi di OCR (riconoscimento ottico dei caratteri) perché scritti a mano. Google sta cercando di entrare in quel mercato.
Il motore di ricerca, che “lastrica” il suo futuro trovando in anticipo sulla concorrenza quelli che saranno i futuri campi di espansione del mercato (e rendendolo in qualche modo pubblico, per costruire come azienda quotata in Borsa il successo – o il recupero, in questo caso – del valore delle sue azioni) adesso sta infatti finanziando la ricerca di una università in questa direzione.
Si tratta della Dublin City University, uno dei centri di eccellenza per l’informatica in Europa (insieme a quelle di Buffalo e del Massachusetts), che sta attivamente lavorando (secondo quanto riporta The Register) a queste tecnologie.
Uno dei primi successi è stato quello rispetto alla comprensione e quindi cercabilità dei diari di George Washington. Dopo aver lavorato su nomi di eccellenza (la ricerca della ricorrenza delle parole nei testi dei personaggi storici è utile per lessicografi e storici, oltre a permettere di comprendere meglio se ulteriori testi autografi sono originali oppure no) l’applicazione sarà con tutta probabilità commerciale. Ci sono milioni di testi scritti a mano e digitalizzati che non è conveniente tradurre con sistemi “umani”. Ma che la tecnologia potrebbe rendere comprensibili e quindi portatori di valori. Si chiama innovazione.