18
NLP in pratica Cristina Bosco Informatica applicata alla comunicazione multimediale 2013-2014

NLP in pratica

Embed Size (px)

DESCRIPTION

NLP in pratica. Cristina Bosco Informatica applicata alla comunicazione multimediale 2013-2014. SYSTRAN. La compagnia SYSTRAN, fondata nel 1968, è una delle più antiche attive nel settore della MT. - PowerPoint PPT Presentation

Citation preview

Page 1: NLP in pratica

NLP in praticaCristina Bosco

Informatica applicata alla comunicazione multimediale

2013-2014

Page 2: NLP in pratica

SYSTRAN

La compagnia SYSTRAN, fondata nel 1968, è una delle più antiche attive nel settore della MT.

Il creatore di SYSTRAN è Peter Toma, attivo fin

dai primi anni ’50 e tra i partecipanti dell’esperimento di Georgetown.

Page 3: NLP in pratica

SYSTRAN

Toma lascia nel 1962 l’università per trasferirsi in Germania dove lavora ai primi prototipi di MT russo-inglese e russo-tedesco.

Tornato negli USA, continua lo sviluppo di SYSTRAN che diventa il sistema usato dall’esercito e dalla NASA.

Negli anni seguenti viene sviluppata la MT per inglese-francese che viene venduta alla Comunità Europea.

Page 4: NLP in pratica

SYSTRAN

SYSTRAN segue un approccio di traduzione diretta basato su regole fino al 2007, quando passa ad un approccio ibrido in cui regole e apprendimento statistico si integrano.

Page 5: NLP in pratica

SYSTRAN

SYSTRAN è alla base di alcuni noti sistemi di traduzione online, come SystraNET

www.systranet.com/

ma anche Yahoo, Babel fish e Google (fino al 2007).

Page 6: NLP in pratica

BING

Bing è il sistema di MT dell’ambiente Microsoft

http://www.bing.com/translator/help/#Home

http://www.bing.com/translator/

Page 7: NLP in pratica

BING

Sistemi di traduzione su telefonibasati su Bing

http://www.bing.com/translator/phone/

Page 8: NLP in pratica

Google translate

http://en.wikipedia.org/wiki/Google_Translate

Page 10: NLP in pratica

Statistical MT

http://www.statmt.org/

Page 12: NLP in pratica

Dizionari

Google dictionaryhttp://google-dictionary.so8848.com/

Anche basati su ontologie, WordNet dictionaryhttp://wordnet-online.freedicts.com/

Page 14: NLP in pratica

Licenze per dati linguistici

http://creativecommons.org/

Enti che rilasciano risorse:European Language Resource Association http

://catalog.elra.info/Linguistic Data Consortium (negli USA)https://www.ldc.upenn.edu/

Page 15: NLP in pratica

Licenze per dati linguistici

Per molti dati la licenza è un problema … ad es. i dati dei social media.

Non si possono pubblicare i Tweet di Twitter, ma solo un riferimento al loro identidicativo.

Page 16: NLP in pratica

Es. Twitter

Page 17: NLP in pratica

Es. Twitter

Page 18: NLP in pratica

Valutazione e Italiano

Campagna di valutazione per il NLP della lingua italiana

http://www.evalita.it/