際際滷

際際滷Share a Scribd company logo
Neural Machine Translation
Il futuro 竪 gi presente
Convegno Unilingue
Villa Cagnola
Gazzada Schianno (VA)
26 maggio 2017
Luigi Muzii
Convegno Unilingue 2017
Convegno Unilingue 2017
Hicsuntleones
Convegno Unilingue 2017
Convegno Unilingue 2017
1940 1950 1960 1970 1980 1990 20202000 2010
Qualit
RbMT
SMT
HMT
NMT
Evoluzione della
traduzione automatica
t
Convegno Unilingue 2017
Strato di uscitaStrati nascostiStrato di
ingresso
Convegno Unilingue 2017
RbMT
PB-SMT
NMT
Convegno Unilingue 2017
Convegno Unilingue 2017
Sorgente IDC, a market-research firm, predicts that the digital universe (the data
created and copied every year) will reach 180 zettabytes (180 followed by
21 zeros) in 2025 (see chart). Pumping it all through a broadband internet
connection would take over 450m years. To speed the transfer into its data
centres, Amazon, an e-commerce giant with a fast-growing cloud-
computing arm, uses trucks pulling shipping containers each packed with
storage devices holding 100 petabytes (a mere 15 zeros).
PB-SMT
(Google Translate)
IDC, un'azienda di ricerca di mercato, prevede che l'universo digitale (i dati
creati e copiati ogni anno) raggiunger 180 zettebiti (180 seguiti da 21 zeri)
nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a
Internet a banda larga richiederebbe 450 milioni di anni. Per velocizzare il
trasferimento nei propri data center, Amazon, un gigante di e-commerce
con un braccio cloud computing in rapida crescita, utilizza camion che
tirapidano contenitori di trasporto ciascuno confezionati con dispositivi di
storage che dispongono di 100 petabyte (meri 15 zeri).
NMT
(Systran Pure neural MT)
IDC, azienda di scienza di mercato, prevede che conosce l'universo digitale
(i dati creati e copiati in farina) raggiunger 180 zettebiti (180 seguiti da 21
zeri) nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a
Internet a banda larga 450 msec. per velocizzare il trasferimento il propri
centre centre, Amazon, nu un di e-commerce con con cloud cloud
computing computing computing che che di che con di che di con di
storage di 100 petabyte (stravaganti 15 zeri).
Convegno Unilingue 2017
Convegno Unilingue 2017
Convegno Unilingue 2017
Approccio Pro Contro
RbMT
 Modello linguistico
 Adatto per lingue con risorse limitate
 Agevole analisi degli errori
 Ridotto consumo di risorse
computazionali
 Necessari regole linguistiche e dizionari
 Coppia linguistica vincolante
 Problemi di disambiguazione
 Sviluppo e manutenzione impegnativi
PB-SMT
 Non richiede conoscenze linguistiche
 Agnostico
 Sviluppo e manutenzione accessibili
 Necessari testi paralleli
 Problemi con coppie linguistiche con
diversa morfologia
 Analisi degli errori impegnativa
NMT
 Non richiede conoscenze linguistiche
 Agnostico
 Sviluppo incrementale
 Limitata manutenzione
 Modesta dimensione del modello
 Autoapprendimento dinamico
 Necessari testi paralleli
 Necessarie risorse computazionali
specifiche (GPGPU)
 Analisi degli errori impraticabile
 Impossibile usare corpus monolingue
 Modesta personalizzazione
Convegno Unilingue 2017
Convegno Unilingue 2017
Convegno Unilingue 2017
Convegno Unilingue 2017
Convegno Unilingue 2017
Attivit a basso
valore aggiunto: i
professionisti
svolgono quelle pi湛
impegnative a
elevato valore
aggiunto
Scomposizione del
processo in attivit
elementari per
individuare quelle
da automatizzare
Automazione
dellintero processo
con espulsione delle
risorse umane
Integrazione delle
competenze umane
con strumenti ad
alta tecnologia per
facilitare lo
svolgimento delle
attivit
Alleggerire
(Relieve)
Scomporre
(Split-up)
Sostituire
(Replace)
Estendere
(Augment)
Chatbot PEMT UGC CAT avanzati
Adattamento dei
contenuti
Registrazione e
archiviazione dati
Profilazione contenuti
Post-editing Selezione risorse Distribuzione contenuti
Project management Allocazione risorse
Determinazione dei
prezzi
Estrazione
terminologica
Valutazione qualit Pianificazione
Alleggerite Estese Sostituite
s-quid.it/30min

More Related Content

Convegno Unilingue 2017

  • 1. Neural Machine Translation Il futuro 竪 gi presente Convegno Unilingue Villa Cagnola Gazzada Schianno (VA) 26 maggio 2017
  • 8. 1940 1950 1960 1970 1980 1990 20202000 2010 Qualit RbMT SMT HMT NMT Evoluzione della traduzione automatica t
  • 10. Strato di uscitaStrati nascostiStrato di ingresso
  • 12. RbMT
  • 14. NMT
  • 17. Sorgente IDC, a market-research firm, predicts that the digital universe (the data created and copied every year) will reach 180 zettabytes (180 followed by 21 zeros) in 2025 (see chart). Pumping it all through a broadband internet connection would take over 450m years. To speed the transfer into its data centres, Amazon, an e-commerce giant with a fast-growing cloud- computing arm, uses trucks pulling shipping containers each packed with storage devices holding 100 petabytes (a mere 15 zeros). PB-SMT (Google Translate) IDC, un'azienda di ricerca di mercato, prevede che l'universo digitale (i dati creati e copiati ogni anno) raggiunger 180 zettebiti (180 seguiti da 21 zeri) nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a Internet a banda larga richiederebbe 450 milioni di anni. Per velocizzare il trasferimento nei propri data center, Amazon, un gigante di e-commerce con un braccio cloud computing in rapida crescita, utilizza camion che tirapidano contenitori di trasporto ciascuno confezionati con dispositivi di storage che dispongono di 100 petabyte (meri 15 zeri). NMT (Systran Pure neural MT) IDC, azienda di scienza di mercato, prevede che conosce l'universo digitale (i dati creati e copiati in farina) raggiunger 180 zettebiti (180 seguiti da 21 zeri) nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a Internet a banda larga 450 msec. per velocizzare il trasferimento il propri centre centre, Amazon, nu un di e-commerce con con cloud cloud computing computing computing che che di che con di che di con di storage di 100 petabyte (stravaganti 15 zeri).
  • 21. Approccio Pro Contro RbMT Modello linguistico Adatto per lingue con risorse limitate Agevole analisi degli errori Ridotto consumo di risorse computazionali Necessari regole linguistiche e dizionari Coppia linguistica vincolante Problemi di disambiguazione Sviluppo e manutenzione impegnativi PB-SMT Non richiede conoscenze linguistiche Agnostico Sviluppo e manutenzione accessibili Necessari testi paralleli Problemi con coppie linguistiche con diversa morfologia Analisi degli errori impegnativa NMT Non richiede conoscenze linguistiche Agnostico Sviluppo incrementale Limitata manutenzione Modesta dimensione del modello Autoapprendimento dinamico Necessari testi paralleli Necessarie risorse computazionali specifiche (GPGPU) Analisi degli errori impraticabile Impossibile usare corpus monolingue Modesta personalizzazione
  • 27. Attivit a basso valore aggiunto: i professionisti svolgono quelle pi湛 impegnative a elevato valore aggiunto Scomposizione del processo in attivit elementari per individuare quelle da automatizzare Automazione dellintero processo con espulsione delle risorse umane Integrazione delle competenze umane con strumenti ad alta tecnologia per facilitare lo svolgimento delle attivit Alleggerire (Relieve) Scomporre (Split-up) Sostituire (Replace) Estendere (Augment) Chatbot PEMT UGC CAT avanzati
  • 28. Adattamento dei contenuti Registrazione e archiviazione dati Profilazione contenuti Post-editing Selezione risorse Distribuzione contenuti Project management Allocazione risorse Determinazione dei prezzi Estrazione terminologica Valutazione qualit Pianificazione Alleggerite Estese Sostituite