27
Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Embed Size (px)

Citation preview

Page 1: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Traduzione e computer(3)

Cristina BoscoInformatica applicata alla

comunicazione multimediale2014-2015

Page 2: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Tipi di sistemi

Fino alla metà degli anni ‘90 esistono solo due tipi di sistemi di MT:

• Sistemi su mainframe di grandi compagnie• Sistemi su personal computerA partire dalla metà degli anni ’90:• Traduttori tascabili• Software di traduzione per telefonia mobile• Servizi di MT su Internet

Page 3: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Sistemi su mainframe

I sistemi di MT che giravano su mainframe di grandi compagnie erano utilizzati per produrre una grande quantità di traduzioni di qualità tale da essere pubblicabili, quindi era necessario che l’output di questi sistemi fosse migliorato.

Per questo motivo furono applicate tecniche di soluzione finalizzate a migliorare la qualità e a limitare l’intervento umano

Page 4: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Soluzioni (applicate nei mainframe)

Le seguenti soluzioni possono aumentare la qualità dell’output dei sistemi di MT:

• Impiego di revisori umani nel post-editing• Sistemi interattivi• Vincolare la varietà del linguaggio di input

Page 5: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

L’impiego di revisori umani (esperti del LS e del LT) nel post-editing è proposto come soluzione per aumentare la qualità delle traduzioni prodotte da MT fin dai primi sistemi.

Progressivamente si svilupparono strumenti per il post-editing specializzati nell’evidenziare errori frequenti e sistematici dei sistemi di MT

Soluzioni (applicate nei mainframe)

Page 6: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Vengono sviluppati sistemi di MT che non richiedono post-editing, ma interagiscono con l’utente durante il processo di traduzione, ad es. nel caso di ambiguità di tipo lessicale o sintattico

Soluzioni (applicate nei mainframe)

Page 7: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Vincolando la varietà del linguaggio di input si limita la difficoltà della traduzione.

In due modi:• Il sistema viene costruito per trattare un certo

tipo di linguaggio (es. quello dei bollettini metereologici)

• Il testo da tradurre viene scritto utilizzando un dizionario ristretto e una struttura sintattica semplificata

Soluzioni (applicate nei mainframe)

Page 8: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

È nel contesto dei sistemi su mainframe per grandi compagnie che si sviluppa l’applicazione della MT al problema della localizzazione.

Localizzazione significa adattamento di prodotti e della relativa documentazione a particolari condizioni culturali che possono variare dal corretto modo di esprimere date, numeri, tempi, indirizzi ed abbreviazioni a modificazioni più complesse del testo per renderlo corrispondente alle aspettative del cliente.

Mainframe e localizzazione

Page 9: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

La localizzazione nasce come effetto dell’immissione sul mercato di prodotti per vari paesi in contemporanea o quasi.

Nasce soprattutto in relazione al software, quindi ad un genere testuale (manuali) caratterizzato da ripetitività e da piccole differenze tra uno e l’altro, tra un’edizione e l’altra.

Mainframe e localizzazione

Page 10: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Sistemi su PC

I sistemi che giravano su personal computer non è chiaro per quali scopi fossero utilizzati, ne’ da chi … prevalentemente per avere traduzioni sommarie di testi diversamente inaccessibili, senza particolare interesse per la pubblicazione del risultato della traduzione

Page 11: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Traduttori tascabili

Sono la versione elettronica dei dizionari tascabili e hanno una analoga diffusione.

Vengono diffusi prevalentemente sul mercato del turismo e dei viaggi

Vengono prodotti per molte lingueNelle versioni più recenti sono in grado di

produrre output vocali

Page 12: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Software di traduzione per telefonia mobile

Sono una estensione delle funzioni dei telefoni cellulari

Riguardano i linguaggi commercialmente dominanti

Nelle versioni più recenti fanno riferimento a database su server

Page 13: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Servizi di traduzione su Internet

Inizialmente non sono ad accesso libero e simultanei

Sono la versione web dei primi sistemi di MT e sono basati su regole, solo recentemente è comparso Google Translate che applica un approccio statistico

Non è chiaro come e da chi sono utilizzati

Page 14: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Servizi di traduzione su Internet

La MT è nuova per la maggior parte degli utenti che scoprono i servizi di traduzione online.

Molti testano i servizi proponendo la traduzione di espressioni idiomatiche e tentano di valutare il servizio con una doppia traduzione.

Il risultato è deludente.

Page 15: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Servizi di traduzione su Internet

Non si hanno dati su chi usa i servizi di traduzione online e per quale scopo.

Sorprendentemente sono poco utilizzati (15%) per lo scopo che parrebbe più ovvio, la traduzione di pagine web.

Nel 50% dei casi vengono sottomesse 1-2 parole, nel restante 50 frasi lunghe mediamente 20 parole

Page 16: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Servizi di traduzione su Internet

Sembrerebbe quindi che siano usati come dizionari, nonostante l’ampia disponibilità di dizionari online

Prevalentemente da persone che conoscono la lingua in cui traducono

Tuttavia l’utilizzo di questi servizi cresce costantemente in modo esponenziale

A partire dal 2000 sono stati sviluppati anche sistemi per la localizzazione di pagine web

Page 17: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Limiti della traduzione e della LC

Ulteriori limiti della MT sono stati messi in evidenza in relazione alla gestione di linguaggi colloquiali, cioè caratterizzati da frequenti ellissi e irregolarità.

Ne sono un esempio:• Messaggi di email• SMS sui cellulari• Messaggi su social network

Page 18: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Limiti della traduzione e della LC

A partire dal 1990 il crescente utilizzo di telecomunicazioni ha portato allo sviluppo di sistemi di traduzioni di messaggi di email e pagine di informazione.

L’importanza per studi politici e sociali dei social network ha evidenziato l’urgenza di trattare testi che vengono prodotti in Facebook e Twitter.

Page 19: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Limiti della traduzione e della LC

Anche se cresce il numero di sistemi in grado di produrre output in forma vocale, la traduzione del linguaggio orale è ancora una delle aree più problematiche.

Non solo per i problemi legati all’analisi e sintesi del parlato, ma anche per la forma particolare dei dialoghi, la massiccia presenza di ellissi e la forte dipendenza dal contesto.

Page 20: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Limiti della traduzione e della LC

Esistono progetti non commerciali per lo sviluppo di sistemi di dialogo e traduzione su domini limitati, come comunicazioni di affari e prenotazioni alberghiere.

Un’area in via di sviluppo riguarda la comunicazione medico-paziente con possibili applicazioni in contesti in cui sono presenti minoranze linguistiche.

Page 21: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Warren Weaver - 1949

“There is no need to do more than mention the obvious fact that a multiplicity of languages impedes cultural interchange between the peoples of the earth, and is a serious deterrent to international understanding.”

Page 22: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

MT per quali lingue?

La MT si è orientata ai suoi esordi alla coppia inglese-russo e successivamente alle lingue commercialmente interessanti (giapponese, tedesco, spagnolo, francese, cinese …).

Pochissima attenzione è stata prestata agli altri linguaggi

Page 23: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

MT per quali lingue?

Da un punto di vista globale, i linguaggi ‘minori’ sono quelli non significativi per le transazioni commerciali

L’immigrazione però fa sì che linguaggi minori siano parlati ovunque.

Page 24: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

MT per quali lingue?

Il problema dei linguaggi delle minorità è dovuto anche alla mancanza di risorse dedicate a tali linguaggi (dizionari, spellchecker … corpora).

E ci sono anche linguaggi di minoranze non di tipo etnico e geografico, come i sordi

Page 25: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

MT per quali lingue?

Negli ultimi anni sono stati sviluppati progetti per la traduzione nel linguaggio dei sordi ad es. per l’italiano

E progetti per la traduzione di sottotitoli di programmi televisivi

Page 26: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Ieri e oggi la MT

Oggi la tendenza è verso lo sviluppo di moduli di traduzione integrati in sistemi che svolgono varie funzioni e meno di sistemi dedicati unicamente alla MT

Oltre alla MT, si lavora su altri task multilingue come Information Retrieval e Information Extraction: la traduzione non è un’attività isolata

Page 27: Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015

Ieri e oggi la MT

Dal punto di vista sociale il mondo è cambiato e di conseguenza la richiesta di MT proviene da utenti diversi e per task diversi rispetto al passato.

Anche le aspettative sono oggi diverse e i risultati positivi riguardano task e domini limitati. La ricerca della traduzione perfetta non ha più senso.