Esami di friulano, Google Translate rimandato a settembre

I primi test di traduzione dal friulano non restituiscono un risultato confortante

Come si traduce ragazza in friulano? Secondo Google Translate la parola giusta è fantate, mentre l’applicativo dimentica completamente frute, termine attestato in diverse varianti locali.

L’aggiornamento di Google Translate – con l’inserimento del friulano, assieme ai dialetti lombardo, veneto, ligure e siciliano – è dei giorni scorsi, ma i primi test effettuati dal team di AlpiLinK, macro-progetto per la mappatura digitale dei dialetti del Nord Italia che vede come capofila l’Università di Verona, non restituiscono un risultato confortante.

La traduzione si basa sull’intelligenza artificiale e sul modello linguistico conversazionale PaLM2 lanciato lo scorso settembre da Google, ma al momento le performance per quanto riguarda la traduzione dei dialetti e delle lingue minoritarie non sono paragonabili a quelli di altri idiomi.

I risultati dell’analisi raccolti in un report.

“I casi che abbiamo raccolto mostrano come la recente introduzione di alcuni dialetti e lingue minoritarie italiane nell’aggiornamento di Google Translate – spiega Stefan Rabanus, docente di linguistica tedesca all’ateneo di Verona e coordinatore scientifico di AlpLinK – pur rappresentando di per sé una buona notizia perché riconosce il valore delle lingue minoritarie, sia soggetta a molti limiti. A differenza delle lingue nazionali, il friulano non fa riferimento a una lingua unitaria, ma a una molteplicità di varianti presenti nello stesso territorio e questo rende ancor più vulnerabile il traduttore che propone una traduzione in maniera indifferenziata per tutto il territorio”.

Se i test con singole parole evidenziano dei problemi, non va meglio – con qualche eccezione – nella traduzione di frasi. Per citare un esempio: ‘per tu dormi più di lui’, Google restituisce con ‘tu durmis plui di lui’, una frase simile a quella veramente attestata nel carnico a Paularo, ma non coglie il fatto che i parlanti tendono a ‘sdoppiare’ il pronome soggetto e traducono con ‘tu tu dormis plui di lui’. Inoltre, nella maggior parte del Friuli il nucleo del verbo è -ua- e non -u-, ad esempio duarmis a Gemona.

Non disponibile l’ascolto audio

Un altro limite è rappresentato dal fatto che, mentre per l’italiano Translate consente anche il riconoscimento vocale, nel caso del friulano non è possibile ascoltare l’audio. Proprio sulla raccolta di contributi audio è basato, invece, il progetto AlpiLinK. Tutte le persone che parlano un dialetto o una lingua minoritaria possono partecipare direttamente alla ricerca attraverso il sito alpilink.it, compilando in poco tempo l’audio-sondaggio dedicato in cui viene proposto all’utente di utilizzare il proprio dialetto o la propria lingua locale per descrivere cosa accade in una scena o per tradurre le parole o frasi indicate, tra cui il sopra citato tu dormi più di lui. Un modello di ricerca partecipativa, che punta sul coinvolgimento “dal basso” e che sta raccogliendo un notevole interesse.

“Un corpus significativo – spiega Rabanus – perché fra il progetto AlpiLinK e il progetto precedente Vinko sono già quasi 2.500 le persone che hanno partecipato, per un totale di circa 225mila file audio. Un database open che abbiamo utilizzato anche per questa analisi dell’attendibilità dei risultati di Google Translate e che permette di cogliere appunto le diverse varietà di una stessa area linguistica, andando a verificare in modo puntuale, per ogni Comune, le parole e le costruzioni utilizzate con la possibilità di ascoltare direttamente gli audio. Un grande lavoro di mappatura che forse, in futuro, si potrà rivelare utile anche per allenare modelli di intelligenza artificiale e contribuire a superare i limiti attuali“.

L’invito a contribuire al progetto attraverso il sito alpilink.it è aperto.