Un milione di frasi per semplificare il lavoro dei software di traduzione

L'Esecutivo della Commissione Europea ha deciso di mettere a disposizione gratuitamente un'eccezionale raccolta di dati linguistici e contribuire alla creazione di una nuova generazione di programmi di traduzione automatica

logomacitynet1200wide 1

L’Esecutivo della Commissione Europea ha deciso di mettere a disposizione una raccolta di circa 1 milione di frasi, associate ad una traduzione di qualità  delle stesse in 22 delle 23 lingue ufficiali dell’UE (incluse quelle dei nuovi Stati membri).

Si tratta di una tipologia di dati estremamente ricca e ricercata (tutti i testi dell’UE sono tradotti da professionisti di alto livello) da quanti si dedicano all’elaborazione di sistemi di traduzione automatica. Con un simile archivio i software di traduzione hanno una base di partenza enorme alla quale attingere e tradurre correttamente e nel loro contesto parole e frasi. I dati possono inoltre contribuire allo sviluppo di altri strumenti linguistici informatizzati come i controllori grammaticali e ortografici, i dizionari on-line e i sistemi di classificazione di testi multilingue.

Le istituzioni dell’UE possiedono più testi multilingue di ogni altra istituzione a causa della necessità  di rendere disponibile la normativa comunitaria in ciascuna delle 23 lingue ufficiali. I servizi di traduzione lavorano con ben 253 coppie di combinazioni linguistiche possibili e producono all’incirca 1,5 milioni di pagine tradotte l’anno. Benché su Internet sia possibile recuperare numerose traduzioni di testi inglesi o francesi, tale materiale risulta scarso per lingue come il lettone o il rumeno e in pratica inesistente per combinazioni di lingue che dispongono di risorse limitate.

[A cura di Mauro Notarianni]