狠狠撸

狠狠撸Share a Scribd company logo
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
TOEIC960点レベルのニューラル機械翻訳サービス
Mirai Translatorとは??
(株)みらい翻訳 取締役 COO&CTO ?居?祐
API Meetup Online #4
2020.9.29
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
2
機械翻訳を事業とする合弁会社(2014-)
モバイル×サービス基盤
翻訳システム
ソリューション
??翻訳サービス
グローバルICTソリューション
?然?語処理技術 多?語翻訳技術 × 翻訳データ
技術?援
出 資
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
3
B2Bを中?としたサービス提供形態
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
4
みらい翻訳プラットフォーム?声翻訳APIサービス
■?声翻訳処理
? ?声認識
? 機械翻訳
? ?声合成
■カスタマイズ機能
? ユーザ辞書
? 翻訳メモリ
■?本語と11?語間の?声翻訳
?本語
?
英語、中国語(簡体字)、中国語(繁
体字)、韓国語、タイ語、ベトナム語、
インドネシア語、ミャンマー語、フラ
ンス語、スペイン語、ポルトガル語
(ブラジル)
多?語?声翻訳 多?語コミュニケーション 多?語発信
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
Mirai TranslatorTM - 企業向けニューラル機械翻訳サービス
5
料?プラン(例)
サービス画?(例)
■ ベーシックプラン?
? 企業向けエントリープラン
? 1ID/?の制限でワード数の制限なく利?可能
その他機能(例)
nリソース管理
翻訳メモリ登録?管理
ユーザ辞書登録?管理
n管理
ユーザ管理ページ
プロファイル管理ページ
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
項? 概要
通信
? SSL通信
? グローバルIPアドレス制限(お申込時に選択可能)
? 2段階認証(お申込時に選択可能)
認証 ? ID?パスワード認証
サーバ ? ?本国内に限定(AWS)
保存データ
? お客様の翻訳処理データは直ちに削除(サービス上に表??翻訳するために?時的に保存し表?後削除)。
ファイル翻訳の結果のみ、お客様がダウンロードできるよう10?間保存し?動削除。お客様にて?動で削除いた
だくことも可能
? ID?パスワードデータ、ユーザ辞書、翻訳メモリ、プロファイル情報はお客様登録データとして暗号化して保存
データ?次利?
? みらい翻訳サービスの精度向上のための、お客様翻訳ログデータの?次利?は?切?なっておりません。
(サービス利?規約に明?化)
脆弱性/ウィルス対策 ? 第三者機関により定期的に脆弱性試験を実施、試験結果に基づき速やかに対応
運?
? ISO27001, 27017(認証取得済み)
のセキュリティ要件に準拠した運?
管理者の扱い ? 弊社情報セキュリティポリシーで定めた管理体制に沿ってデータにアクセスできる管理者を制限
セキュリティに関する
お問い合わせ
? セキュリティチェックシート対応
?いセキュリティ
6
IS 692259/ ISO27001
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
7
TOEIC900点以上の英作?能?(2017.6.28報道発表)
TOEIC690点の被験者の翻訳結果
と機械翻訳結果の比較、83%の文章
で機械翻訳が勝った
TOEIC880点の被験者の翻訳結
果と機械翻訳結果の比較、73%
の文章で機械翻訳が勝った
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
?い翻訳精度(?本語?英語)
l?語?向??本語→英語、英語 →?本語
l内容?ビジネスコミュニケーション、経済系ニュース
l?較対象? 1. みらい翻訳エンジン(NMT)
2. ??翻訳(TOEIC900点台のスコアを有する?本?ビジネスマン。辞書使?可)
3.?本?プロ翻訳者(翻訳を専業としている2名の翻訳者。辞書使?可)
TOEIC960点のビジネスマンとほぼ同等、?本語→英語はプロ翻訳者に並ぶ
8
語学堪能な?本?ビジネスマンも流暢な英訳は難しい
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
?い翻訳精度(?本語?中国語)
l?語?向??本語→中国語(簡) 、中国語(簡) →?本語
l内容?ビジネスコミュニケーション、経済系ニュース
l?較対象? 1. みらい翻訳エンジン(NMT)
2. ??翻訳(N1*を保有する中国語ネイティブのビジネスマン。辞書使?可。2名の平均)
2. ??翻訳(中国語ネイティブのプロ翻訳者。辞書使?可。2名の平均)
*N1?本語能?試験(JLPT)の最も難易度の?いレベルで合格率30%程度。
N1*保有の中国語ネイティブのビジネスマンとほぼ同等、中?はプロ翻訳者ともほぼ同等
9
3.86
3.68
3.92
4.05
3.93
4.18
1.0
2.0
3.0
4.0
5.0
?中機械翻訳エンジン ビジネスマン(平均) プロ翻訳者(平均)
?本語→中国語
情報伝達? 流暢さ
4.37 4.45 4.394.44 4.45 4.41
0.0
1.0
2.0
3.0
4.0
5.0
?中機械翻訳エンジン ビジネスマン(平均) プロ翻訳者(平均)
中国語→?本語
情報伝達? 流暢さ
?本語堪能な中国?翻訳者と同等の機械翻訳
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
「Google翻訳より?精度」とTwitterで話題に!
① TOEIC960点相当の精度とプレス発表(2019/4/17)
② 窓の杜「無料で“Google 翻訳”より?精度? “みらい翻訳”のお試し翻訳が便利」と記事掲載
③ 「Twitterでgoogle翻訳より精度が?い」と拡散、最?1,794ツイート/?
④ 窓の杜の4?記事アクセスランキングで1位に
10
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
11
NMT (Neural Machine Translation)
エンコーダ?
原?を中間表現に変換
デコーダ?
中間表現から訳?を?成
中間表現は?次元の
数値特徴量
Encoder-Decoderモデル
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
より?脈を考慮した翻訳が可能に
12
原? 某社翻訳 みらい翻訳
太郎は不機嫌であったが?につけて
いるブローチはピカピカであった。
Taro was cranky, but the brooch
that he wore was shiny.
Taro was in a bad mood, but his
brooch was shiny.
ナタリーは不機嫌であったが?につ
けているブローチはピカピカであっ
た。
Natalie was sullen but the
brooch that he wore was shiny.
Natalie was in a bad mood, but
her brooch was shiny.
花?さんは病気になったが、翌?な
くなった。
Hanako got sick, but the next
day she gone.
Hanako got sick, but she died
the next day.
花?さんはペンを買ったが、翌?な
くなった。
Hanako bought a pen, but the
next day she gone.
Hanako bought a pen, but it
disappeared the next day.
??先?はつまらない講義をしてお
り、とても眠たい。
Professor Yamada has a boring
lecture and I am very sleepy.
Mr. Yamada is giving a boring
lecture and I'm very sleepy.
??先?はしばらく夜更かししてお
り、とても眠たい。
Professor Yamada is staying up
late for a while for a while and I
am very sleepy.
Dr. Yamada has been staying up
late for a while and is very
sleepy.
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
契約書?法務モデル
13
項? 概要
サービスの特徴
契約書?法務?書(法令、規程、規約など)の専?性の?い?章の翻訳に対応する専?モデル
?契約書における条?や節などのフォーマットに則した適切な?い回しに翻訳
?法務?書のガイドラインなどを参考に、法務分野として?然な?本語?英語を出?
ローンチ時期 2019年9?3?(?)正式提供開始
提供?語 ?本語<>英語、?本語<>中国語(簡体字、繁体字)
翻訳モデル名 契約書?法務モデル
対象?章
アンダーソン??利?友常法律事務所の協?により「契約書?法務モデル」を開発し、
Mirai TranslatorTMにて提供を開始
契約書
売買?販売代理契約、秘密保持契
約、IT関連契約、知的財産ライセ
ンス契約、業務提携契約、業務委
託契約、財務?会社法関連契約、
?融関連契約、?事労務契約、不
動産契約など
法令?ガイドライン
?法、?事訴訟法、消費者契
約法、刑法、刑事訴訟法、司
法関連法、出?国管理、各専
?分野の法令など
規程?ポリシー
?事規程(就業規則、給与規程、
旅費規程など)、職務権限規程、
個?情報保護規程、リスク管理規
程、役員規程、経理規程、コンプ
ライアンス規程、倫理規程など
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
契約書?法務モデル(翻訳精度)
14
14
みらい翻訳がビジネス?書全般を対象に提供している汎?モデルと?較して、法務分野の翻訳精度が
向上しました。
3.83
4.43
4.22
4.62
3.20
3.40
3.60
3.80
4.00
4.20
4.40
4.60
4.80
汎?モデル 契約書?法務モデル
?本語→英語
情報伝達? 流暢さ
3.53
4.22
4.07
4.40
3.20
3.40
3.60
3.80
4.00
4.20
4.40
4.60
4.80
汎?モデル 契約書?法務モデル
英語→?本語
情報伝達? 流暢さ
l?語?向??本語→英語、英語 →?本語
l内容?契約書?章
l?較対象? 1. みらい翻訳(汎?モデル)
2. みらい翻訳(契約書?法務モデル)
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
翻訳例1(契約書?法務モデル)
15
原? Amendment to clarify that consent from the Lenders is not required in order to modify the
Organizational Documents of the Borrower in connection with the change of the notice address of
the Borrower or to effectuate the Pattern Transfer.
参照?
(??翻訳)
借??の通知先住所の変更に伴って?はパターン譲渡を実施するために借??の組織関連書類を変更するのに、
貸付?からの同意を要しないことを明確にするための変更。
汎?モデル 借?者の通知先住所の変更に関連して借?者の組織?書を修正したり、パターン移転を実施するためには、借
?者の同意は必要ないことを明確にするための修正。
契約書?
法務モデル
借??の通知先住所の変更に関連して借??の組織?書を変更し、?はパターン移転を実施するために、貸出
?の同意を要しないことを明確化するための変更。
法務分野などの専?的な語彙を学習することで、契約書として適切な訳出が可能となり、翻訳精度が改善
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
翻訳例2(契約書?法務モデル)
16
原? (b) Subject to the payment by a Subscriber of the Aggregate Issue Price referable to that Subscriber
as provided in Section 1.2(a) above, the Company shall issue the New Shares to that Subscriber on
the day (the “Issue Date”) immediately following the Payment Date. On the Issue Date, the
Company shall register the relevant Subscriber as the holders of the New Shares referable to that
Subscriber in the Company?s register of shareholders.
参照?
(??翻訳)
(b) 各引受?が上記第1.2条(a)項の規定に従い当該引受?に係る発?総額を払い込むことを条件に、発?会社
は、払込?の翌?(以下、「発??」という)に、当該引受?に対して本件新株を発?するものとする。発?
会社は、発??に、当該引受?を当該引受?に係る本件新株の株主として発?会社の株主名簿に登録するもの
とする。
汎?モデル ( b ) 当社は、第1.2条(a)に定める新株予約権者による払込?の翌?(「発??」)に当該新株予約権者に対し
て新株予約権を発?するものとします。発??には、当社は、当該新株予約権者を当該新株予約権者に係る新
株予約権者として当社株主名簿に登録するものとします。
契約書?
法務モデル
( b ) 各引受?が上記第1.2条(a)の規定に従い当該引受?に係る発?総額を払い込むことを条件に、発?会社
は、払込?の翌?(「発??」)に、当該引受?に対して本件新株を発?するものとする。発?会社は、発??
に、当該引受?を当該引受?に係る本件新株の株主として発?会社の株主名簿に登録するものとする。
?体を「である調(常体)」で統?
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
翻訳例3(契約書?法務モデル)
17
原? The Employee hereby acknowledges that the foregoing sum is and will be the total and only consideration
and benefit to be paid to him with respect to his resignation from the Company, and that he will not be
entitled to any other payments or benefits from the Company or any of its affiliates (which mean any
corporations or other business entities that , directly or indirectly , through the majority ownership of the
voting stock , control , are controlled by, or are under common control with , the Company . This
definition is applicable hereinbelow.) on any grounds whatsoever due to or in relation to his resignation
from the Company.
参照?
(??翻訳)
?は、上記の?額が、?が甲を退職することに関連して?に?払われる唯?かつすべての対価かつ利益であること、
名?のいかんを問わず、?の甲からの退職を理由としてまたはこれに関連して、甲または甲の関連会社(議決権株式
の過半数を保有することにより、直接または間接に、甲を?配し、甲に?配され、または甲と共通の?配下にある会
社その他の事業体をいう。以下同じ。)からそれ以外の何らかの?払または利益を受ける権利を?は全く持たないこ
とを認める。
汎?モデル 従業員は、会社からの辞任に関して従業員に?払われるべき報酬および利益の合計額であり、またこれから?払われ
る唯?の合計額であること、また、従業員は会社またはその関連会社 (直接または間接に、議決権株式の過半数の所
有を通じて、会社によって?配されているか、会社によって?配されているか、または会社と共通の?配下にある会
社またはその他の事業体をいう。以下、この定義を適?する。) を、会社の辞任に関連して、またはそれに起因して、
またはそれに関連して取得したものとします。
契約書?
法務モデル
当従業員はここに、上記の?額が当会社からの退職に関して当従業員に?払われるべき合計かつ唯?の対価及び利益
であり、当会社からの退職に起因?は関連するいかなる理由にせよ、当会社?はその関連会社(「当社」 とは、議決
権ある株式の過半数を直接?は間接に保有することにより、当社を?配し、当社により?配され、?は当社と共通の
?配下にある法?その他の事業体をいう。この定義は以下に適?される。)からその他の?払?は利益を受ける権利
はないことを認める。
独特な?い回しを含む法務?章を学習することで、法務?章特有の難解かつ??の翻訳精度が向上
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 18
機械翻訳の変遷
RBMT
(ルールベース機械翻訳)
SMT
(統計的機械翻訳)
NMT
(ニューラル機械翻訳)
?語学者が構築した
膨?な変換ルール
対訳データから学習した
統計的モデル
対訳データから学習した
神経回路モデル
?章を中間表現に変換、
相?側?語で表現する
統計的モデルに基づき
単語やフレーズを変換、
?章として組み?てる
辞書と?法に基づき
単語やフレーズを変換
?本 で
試験
In Japan
exam
0.9
0.3SVO -> SOV
A ∧ B -> C
1950?80年代前半 1980後半~2010年代前半 2010年代後半~???
膨?な対訳データを?いた機械学習
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
19
【参考】ルール型翻訳(RBMT)の仕組み
? ルール型翻訳は、?法規則や辞書から??により翻訳ルールを作成し、機械的に
訳?を?成
翻訳ルール
(解析?変換??成)
??により
翻訳ルールを作成
(ルール化?例外?優先順位付け)
① ?法規則や辞書を収集 ② 翻訳ルールを作成
翻訳エンジン
(ルール型翻訳)
?量の翻訳?
例
?量の翻訳?
例
?量の翻訳?
例動詞句
動詞 名詞句
英語
?量の翻訳?
例
?量の翻訳?
例
?量の翻訳?
例complication
?本語英語
複雑化
複雑な要因
複雑な関係
合併症
?
法
規
則
辞
書
(原?) (翻訳?)
Complications are
minimal.
複雑化は最低である。
動詞句
動詞後置換句
?本語 RBMT: Rule Based
Machine Translation
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
20
【参考】統計型機械翻訳(SMT)の仕組み
(原?)
Complications are
minimal.
合併症は最?限である。
(翻訳?)
? 統計的機械翻訳は、?量の対訳データから統計モデルを学習して、機械的に訳
?を?成
翻訳モデル
翻訳/?語モデルの?成
(統計的学習)
① ?量の対訳データを収集 ② 学習により統計的モデルを作成
?量の翻訳?例?量の翻訳?例?量の翻訳?例
Fever is not prominent.
発熱は顕著ではない。
Clusters of cases are common.
集団の症例であることが多い。
翻訳エンジン
(統計的機械翻訳)
?語モデル
SMT: Statistical
Machine Translation
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
【参考】SMT: 翻訳の仕組み(単語単位)
n素朴な?法?単語単位で考える
I saw the movie last night
私は 最後の 夜 その 映画 を?た
私は を?た その 映画 最後の 夜
↓ ↓ ↓ ↓ ↓ ↓
単語単位
の翻訳
語順の
並べ替え
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
【参考】 SMT: 翻訳の仕組み(句単位)
n少し改良?句単位で考える
I saw the movie last night
↓ ↓ ↓ ↓
私は を?た その映画 昨夜
句単位
の翻訳
私は 昨夜 その映画 を?た
語順の
並べ替え
句単位
に分割
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
【参考】 SMT: 翻訳?順①
句単位の対訳候補を列挙?並べ替え&組合せ探索
I saw the movie last night
私は に会った その 映画 最後の 夜
僕は を?た あの 動画 最近の 晩
私 のこぎり 例の 映画館 続く 夜の
私は?た その映画 昨夜
を?た あの映画 ?べ
その映画を?た
昨夜の映画
映画を?た
私は
を?た
その映画 昨夜
私は 昨夜 その映画 を?た
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
【参考】 SMT: 翻訳?順②
翻訳?の候補(仮説)が多数、?成される
I saw the movie last night
私は に会った その 映画 最後の 夜
僕は を?た あの 動画 最近の 晩
私 のこぎり 例の 映画館 続く 夜の
私は?た その映画 昨夜
を?た あの映画 ?べ
その映画を?た
昨夜の映画
映画を?た
私は最後の夜その映画を?た
僕はその映画を?た昨夜
私は昨夜その映画を?た
あの映画を?た昨夜
私は最近の夜のあの動画を?た
昨夜の映画に会った私は
最後の夜に会った私あの映画館
私を?たあの映画続く夜
僕はのこぎり昨夜その映画
その映画を?た最後の夜の
私は?べあの映画に会った
?語モデルも考慮し
選択
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
25
【参考】ニューラル機械翻訳(NMT)の仕組み
(原?)
Complications are
minimal.
合併症は最?限である。
(翻訳?)
① ?量の対訳データ
(原?/訳?のペア)を収集
②ニューラルネットワークの学習
→ノードとエッジの重みを学習
Fever is not prominent. 発熱は顕著ではない。
Clusters of cases are common. 集団の症例であることが多い。
翻訳エンジン
(ニューラルネット)
原? 訳?
????? ?????
③翻訳エンジンへの搭載
NMT: Neural
Machine Translation
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
26
NMTの?所/短所
?所 短所
ü ?い翻訳精度。特に、従来技術に?べ
?然な?章を?成する。
ü 追加学習が容易。カスタマイズがしや
すい。
ü 原理が簡単。理解するハードルが下が
り初学者にも優しい。
ü ニューラルネットワークのサイズは利
?する対訳コーパスの量に依らない
→ 必要なメモリサイズが増えない
ü うまくいく理由が?分に分かっていない。
ü 原?を過不?なくカバーして翻訳しない
→ 訳抜け、湧き出し、過剰?成などが起
きる
ü 翻訳エラーがあった場合に修正する?法
が明確ではない。
ü 辞書を?分に制御して当てるのが難しい
ü GPUマシンが必要(特に学習時)
→ CPUマシンでも可能だが、時間がか
かってしまう
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
ニューラルネットワークによる機械翻訳の未来
27
? Zero-Shot Translation
? “Zero-Shot Translation with Google?s Multilingual Neural Machine Translation System”
https://ai.googleblog.com/2017/08/transformer-novel-neural-network.html
? “対訳”データが不要に
? 「AI翻訳、対訳いらずに ?フェイスブックなど新技術」?本経済新聞 電?版 2018/10/28
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
28
10年後、我々の?活は
どう変わるでしょうか?
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
VISION
Make machine translation the new lingua franca to bring new life
and work style across different languages by 2028.
(provide English native speakers' experience to the rest.)
?語の壁を超え、新しい?活と仕事の様式をもたらす
共通語の機能を機械翻訳として2028年までに作る。
(世界のすべての?々に英語を?国語とする?々と同じ体験を与える.)
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
TOEIC960点のアシスタントを体験 無料です?
30
https://miraitranslate.com/trial/
「お試し翻訳」で検索? ?本語、英語、中国語、イタリア語、スペイン語、
ドイツ語、フランス語、ポルトガル語、ロシア語
がお試しできます。
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
31
WE ARE HIRING! (主な募集職種)
リードテック
機械翻訳エンジニア
フロントエンド
エンジニア
機械翻訳エンジン開発PM
※ポテンシャル可
バックエンド
エンジニア
みらい翻訳では1→10→100に向け
仲間を絶賛募集中です?
SREエンジニア プロダクトプランナー
アライアンス
セールスマネージャー
(予定)
UI/UXディレクター
マーケティングマネージャー
(予定)
カスタマーサクセス
(予定)
採?担当、経理担当
(予定)
「Wantedly みらい翻訳」
で検索?
CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved.
32
谢谢 ?? ??? ?????? Cám ?n Terima kasih
Баярлалаа ?"???? ???????????? Te?ekkürler ?????
Спасибо ευχαριστ? Grazie Merci Gracias
Danke D?kuji Obrigado Tack Kiitos Asante
???? ????? ありがとうございました
An artificial intelligence approach to translation
will revolutionize your business.

More Related Content

TOEIC960点レベルのニューラル機械翻訳サービス Mirai Translatorとは!?

  • 1. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. TOEIC960点レベルのニューラル機械翻訳サービス Mirai Translatorとは?? (株)みらい翻訳 取締役 COO&CTO ?居?祐 API Meetup Online #4 2020.9.29
  • 2. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 2 機械翻訳を事業とする合弁会社(2014-) モバイル×サービス基盤 翻訳システム ソリューション ??翻訳サービス グローバルICTソリューション ?然?語処理技術 多?語翻訳技術 × 翻訳データ 技術?援 出 資
  • 3. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 3 B2Bを中?としたサービス提供形態
  • 4. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 4 みらい翻訳プラットフォーム?声翻訳APIサービス ■?声翻訳処理 ? ?声認識 ? 機械翻訳 ? ?声合成 ■カスタマイズ機能 ? ユーザ辞書 ? 翻訳メモリ ■?本語と11?語間の?声翻訳 ?本語 ? 英語、中国語(簡体字)、中国語(繁 体字)、韓国語、タイ語、ベトナム語、 インドネシア語、ミャンマー語、フラ ンス語、スペイン語、ポルトガル語 (ブラジル) 多?語?声翻訳 多?語コミュニケーション 多?語発信
  • 5. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. Mirai TranslatorTM - 企業向けニューラル機械翻訳サービス 5 料?プラン(例) サービス画?(例) ■ ベーシックプラン? ? 企業向けエントリープラン ? 1ID/?の制限でワード数の制限なく利?可能 その他機能(例) nリソース管理 翻訳メモリ登録?管理 ユーザ辞書登録?管理 n管理 ユーザ管理ページ プロファイル管理ページ
  • 6. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 項? 概要 通信 ? SSL通信 ? グローバルIPアドレス制限(お申込時に選択可能) ? 2段階認証(お申込時に選択可能) 認証 ? ID?パスワード認証 サーバ ? ?本国内に限定(AWS) 保存データ ? お客様の翻訳処理データは直ちに削除(サービス上に表??翻訳するために?時的に保存し表?後削除)。 ファイル翻訳の結果のみ、お客様がダウンロードできるよう10?間保存し?動削除。お客様にて?動で削除いた だくことも可能 ? ID?パスワードデータ、ユーザ辞書、翻訳メモリ、プロファイル情報はお客様登録データとして暗号化して保存 データ?次利? ? みらい翻訳サービスの精度向上のための、お客様翻訳ログデータの?次利?は?切?なっておりません。 (サービス利?規約に明?化) 脆弱性/ウィルス対策 ? 第三者機関により定期的に脆弱性試験を実施、試験結果に基づき速やかに対応 運? ? ISO27001, 27017(認証取得済み) のセキュリティ要件に準拠した運? 管理者の扱い ? 弊社情報セキュリティポリシーで定めた管理体制に沿ってデータにアクセスできる管理者を制限 セキュリティに関する お問い合わせ ? セキュリティチェックシート対応 ?いセキュリティ 6 IS 692259/ ISO27001
  • 7. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 7 TOEIC900点以上の英作?能?(2017.6.28報道発表) TOEIC690点の被験者の翻訳結果 と機械翻訳結果の比較、83%の文章 で機械翻訳が勝った TOEIC880点の被験者の翻訳結 果と機械翻訳結果の比較、73% の文章で機械翻訳が勝った
  • 8. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. ?い翻訳精度(?本語?英語) l?語?向??本語→英語、英語 →?本語 l内容?ビジネスコミュニケーション、経済系ニュース l?較対象? 1. みらい翻訳エンジン(NMT) 2. ??翻訳(TOEIC900点台のスコアを有する?本?ビジネスマン。辞書使?可) 3.?本?プロ翻訳者(翻訳を専業としている2名の翻訳者。辞書使?可) TOEIC960点のビジネスマンとほぼ同等、?本語→英語はプロ翻訳者に並ぶ 8 語学堪能な?本?ビジネスマンも流暢な英訳は難しい
  • 9. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. ?い翻訳精度(?本語?中国語) l?語?向??本語→中国語(簡) 、中国語(簡) →?本語 l内容?ビジネスコミュニケーション、経済系ニュース l?較対象? 1. みらい翻訳エンジン(NMT) 2. ??翻訳(N1*を保有する中国語ネイティブのビジネスマン。辞書使?可。2名の平均) 2. ??翻訳(中国語ネイティブのプロ翻訳者。辞書使?可。2名の平均) *N1?本語能?試験(JLPT)の最も難易度の?いレベルで合格率30%程度。 N1*保有の中国語ネイティブのビジネスマンとほぼ同等、中?はプロ翻訳者ともほぼ同等 9 3.86 3.68 3.92 4.05 3.93 4.18 1.0 2.0 3.0 4.0 5.0 ?中機械翻訳エンジン ビジネスマン(平均) プロ翻訳者(平均) ?本語→中国語 情報伝達? 流暢さ 4.37 4.45 4.394.44 4.45 4.41 0.0 1.0 2.0 3.0 4.0 5.0 ?中機械翻訳エンジン ビジネスマン(平均) プロ翻訳者(平均) 中国語→?本語 情報伝達? 流暢さ ?本語堪能な中国?翻訳者と同等の機械翻訳
  • 10. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 「Google翻訳より?精度」とTwitterで話題に! ① TOEIC960点相当の精度とプレス発表(2019/4/17) ② 窓の杜「無料で“Google 翻訳”より?精度? “みらい翻訳”のお試し翻訳が便利」と記事掲載 ③ 「Twitterでgoogle翻訳より精度が?い」と拡散、最?1,794ツイート/? ④ 窓の杜の4?記事アクセスランキングで1位に 10
  • 11. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 11 NMT (Neural Machine Translation) エンコーダ? 原?を中間表現に変換 デコーダ? 中間表現から訳?を?成 中間表現は?次元の 数値特徴量 Encoder-Decoderモデル
  • 12. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. より?脈を考慮した翻訳が可能に 12 原? 某社翻訳 みらい翻訳 太郎は不機嫌であったが?につけて いるブローチはピカピカであった。 Taro was cranky, but the brooch that he wore was shiny. Taro was in a bad mood, but his brooch was shiny. ナタリーは不機嫌であったが?につ けているブローチはピカピカであっ た。 Natalie was sullen but the brooch that he wore was shiny. Natalie was in a bad mood, but her brooch was shiny. 花?さんは病気になったが、翌?な くなった。 Hanako got sick, but the next day she gone. Hanako got sick, but she died the next day. 花?さんはペンを買ったが、翌?な くなった。 Hanako bought a pen, but the next day she gone. Hanako bought a pen, but it disappeared the next day. ??先?はつまらない講義をしてお り、とても眠たい。 Professor Yamada has a boring lecture and I am very sleepy. Mr. Yamada is giving a boring lecture and I'm very sleepy. ??先?はしばらく夜更かししてお り、とても眠たい。 Professor Yamada is staying up late for a while for a while and I am very sleepy. Dr. Yamada has been staying up late for a while and is very sleepy.
  • 13. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 契約書?法務モデル 13 項? 概要 サービスの特徴 契約書?法務?書(法令、規程、規約など)の専?性の?い?章の翻訳に対応する専?モデル ?契約書における条?や節などのフォーマットに則した適切な?い回しに翻訳 ?法務?書のガイドラインなどを参考に、法務分野として?然な?本語?英語を出? ローンチ時期 2019年9?3?(?)正式提供開始 提供?語 ?本語<>英語、?本語<>中国語(簡体字、繁体字) 翻訳モデル名 契約書?法務モデル 対象?章 アンダーソン??利?友常法律事務所の協?により「契約書?法務モデル」を開発し、 Mirai TranslatorTMにて提供を開始 契約書 売買?販売代理契約、秘密保持契 約、IT関連契約、知的財産ライセ ンス契約、業務提携契約、業務委 託契約、財務?会社法関連契約、 ?融関連契約、?事労務契約、不 動産契約など 法令?ガイドライン ?法、?事訴訟法、消費者契 約法、刑法、刑事訴訟法、司 法関連法、出?国管理、各専 ?分野の法令など 規程?ポリシー ?事規程(就業規則、給与規程、 旅費規程など)、職務権限規程、 個?情報保護規程、リスク管理規 程、役員規程、経理規程、コンプ ライアンス規程、倫理規程など
  • 14. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 契約書?法務モデル(翻訳精度) 14 14 みらい翻訳がビジネス?書全般を対象に提供している汎?モデルと?較して、法務分野の翻訳精度が 向上しました。 3.83 4.43 4.22 4.62 3.20 3.40 3.60 3.80 4.00 4.20 4.40 4.60 4.80 汎?モデル 契約書?法務モデル ?本語→英語 情報伝達? 流暢さ 3.53 4.22 4.07 4.40 3.20 3.40 3.60 3.80 4.00 4.20 4.40 4.60 4.80 汎?モデル 契約書?法務モデル 英語→?本語 情報伝達? 流暢さ l?語?向??本語→英語、英語 →?本語 l内容?契約書?章 l?較対象? 1. みらい翻訳(汎?モデル) 2. みらい翻訳(契約書?法務モデル)
  • 15. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 翻訳例1(契約書?法務モデル) 15 原? Amendment to clarify that consent from the Lenders is not required in order to modify the Organizational Documents of the Borrower in connection with the change of the notice address of the Borrower or to effectuate the Pattern Transfer. 参照? (??翻訳) 借??の通知先住所の変更に伴って?はパターン譲渡を実施するために借??の組織関連書類を変更するのに、 貸付?からの同意を要しないことを明確にするための変更。 汎?モデル 借?者の通知先住所の変更に関連して借?者の組織?書を修正したり、パターン移転を実施するためには、借 ?者の同意は必要ないことを明確にするための修正。 契約書? 法務モデル 借??の通知先住所の変更に関連して借??の組織?書を変更し、?はパターン移転を実施するために、貸出 ?の同意を要しないことを明確化するための変更。 法務分野などの専?的な語彙を学習することで、契約書として適切な訳出が可能となり、翻訳精度が改善
  • 16. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 翻訳例2(契約書?法務モデル) 16 原? (b) Subject to the payment by a Subscriber of the Aggregate Issue Price referable to that Subscriber as provided in Section 1.2(a) above, the Company shall issue the New Shares to that Subscriber on the day (the “Issue Date”) immediately following the Payment Date. On the Issue Date, the Company shall register the relevant Subscriber as the holders of the New Shares referable to that Subscriber in the Company?s register of shareholders. 参照? (??翻訳) (b) 各引受?が上記第1.2条(a)項の規定に従い当該引受?に係る発?総額を払い込むことを条件に、発?会社 は、払込?の翌?(以下、「発??」という)に、当該引受?に対して本件新株を発?するものとする。発? 会社は、発??に、当該引受?を当該引受?に係る本件新株の株主として発?会社の株主名簿に登録するもの とする。 汎?モデル ( b ) 当社は、第1.2条(a)に定める新株予約権者による払込?の翌?(「発??」)に当該新株予約権者に対し て新株予約権を発?するものとします。発??には、当社は、当該新株予約権者を当該新株予約権者に係る新 株予約権者として当社株主名簿に登録するものとします。 契約書? 法務モデル ( b ) 各引受?が上記第1.2条(a)の規定に従い当該引受?に係る発?総額を払い込むことを条件に、発?会社 は、払込?の翌?(「発??」)に、当該引受?に対して本件新株を発?するものとする。発?会社は、発?? に、当該引受?を当該引受?に係る本件新株の株主として発?会社の株主名簿に登録するものとする。 ?体を「である調(常体)」で統?
  • 17. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 翻訳例3(契約書?法務モデル) 17 原? The Employee hereby acknowledges that the foregoing sum is and will be the total and only consideration and benefit to be paid to him with respect to his resignation from the Company, and that he will not be entitled to any other payments or benefits from the Company or any of its affiliates (which mean any corporations or other business entities that , directly or indirectly , through the majority ownership of the voting stock , control , are controlled by, or are under common control with , the Company . This definition is applicable hereinbelow.) on any grounds whatsoever due to or in relation to his resignation from the Company. 参照? (??翻訳) ?は、上記の?額が、?が甲を退職することに関連して?に?払われる唯?かつすべての対価かつ利益であること、 名?のいかんを問わず、?の甲からの退職を理由としてまたはこれに関連して、甲または甲の関連会社(議決権株式 の過半数を保有することにより、直接または間接に、甲を?配し、甲に?配され、または甲と共通の?配下にある会 社その他の事業体をいう。以下同じ。)からそれ以外の何らかの?払または利益を受ける権利を?は全く持たないこ とを認める。 汎?モデル 従業員は、会社からの辞任に関して従業員に?払われるべき報酬および利益の合計額であり、またこれから?払われ る唯?の合計額であること、また、従業員は会社またはその関連会社 (直接または間接に、議決権株式の過半数の所 有を通じて、会社によって?配されているか、会社によって?配されているか、または会社と共通の?配下にある会 社またはその他の事業体をいう。以下、この定義を適?する。) を、会社の辞任に関連して、またはそれに起因して、 またはそれに関連して取得したものとします。 契約書? 法務モデル 当従業員はここに、上記の?額が当会社からの退職に関して当従業員に?払われるべき合計かつ唯?の対価及び利益 であり、当会社からの退職に起因?は関連するいかなる理由にせよ、当会社?はその関連会社(「当社」 とは、議決 権ある株式の過半数を直接?は間接に保有することにより、当社を?配し、当社により?配され、?は当社と共通の ?配下にある法?その他の事業体をいう。この定義は以下に適?される。)からその他の?払?は利益を受ける権利 はないことを認める。 独特な?い回しを含む法務?章を学習することで、法務?章特有の難解かつ??の翻訳精度が向上
  • 18. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 18 機械翻訳の変遷 RBMT (ルールベース機械翻訳) SMT (統計的機械翻訳) NMT (ニューラル機械翻訳) ?語学者が構築した 膨?な変換ルール 対訳データから学習した 統計的モデル 対訳データから学習した 神経回路モデル ?章を中間表現に変換、 相?側?語で表現する 統計的モデルに基づき 単語やフレーズを変換、 ?章として組み?てる 辞書と?法に基づき 単語やフレーズを変換 ?本 で 試験 In Japan exam 0.9 0.3SVO -> SOV A ∧ B -> C 1950?80年代前半 1980後半~2010年代前半 2010年代後半~??? 膨?な対訳データを?いた機械学習
  • 19. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 19 【参考】ルール型翻訳(RBMT)の仕組み ? ルール型翻訳は、?法規則や辞書から??により翻訳ルールを作成し、機械的に 訳?を?成 翻訳ルール (解析?変換??成) ??により 翻訳ルールを作成 (ルール化?例外?優先順位付け) ① ?法規則や辞書を収集 ② 翻訳ルールを作成 翻訳エンジン (ルール型翻訳) ?量の翻訳? 例 ?量の翻訳? 例 ?量の翻訳? 例動詞句 動詞 名詞句 英語 ?量の翻訳? 例 ?量の翻訳? 例 ?量の翻訳? 例complication ?本語英語 複雑化 複雑な要因 複雑な関係 合併症 ? 法 規 則 辞 書 (原?) (翻訳?) Complications are minimal. 複雑化は最低である。 動詞句 動詞後置換句 ?本語 RBMT: Rule Based Machine Translation
  • 20. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 20 【参考】統計型機械翻訳(SMT)の仕組み (原?) Complications are minimal. 合併症は最?限である。 (翻訳?) ? 統計的機械翻訳は、?量の対訳データから統計モデルを学習して、機械的に訳 ?を?成 翻訳モデル 翻訳/?語モデルの?成 (統計的学習) ① ?量の対訳データを収集 ② 学習により統計的モデルを作成 ?量の翻訳?例?量の翻訳?例?量の翻訳?例 Fever is not prominent. 発熱は顕著ではない。 Clusters of cases are common. 集団の症例であることが多い。 翻訳エンジン (統計的機械翻訳) ?語モデル SMT: Statistical Machine Translation
  • 21. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 【参考】SMT: 翻訳の仕組み(単語単位) n素朴な?法?単語単位で考える I saw the movie last night 私は 最後の 夜 その 映画 を?た 私は を?た その 映画 最後の 夜 ↓ ↓ ↓ ↓ ↓ ↓ 単語単位 の翻訳 語順の 並べ替え
  • 22. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 【参考】 SMT: 翻訳の仕組み(句単位) n少し改良?句単位で考える I saw the movie last night ↓ ↓ ↓ ↓ 私は を?た その映画 昨夜 句単位 の翻訳 私は 昨夜 その映画 を?た 語順の 並べ替え 句単位 に分割
  • 23. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 【参考】 SMT: 翻訳?順① 句単位の対訳候補を列挙?並べ替え&組合せ探索 I saw the movie last night 私は に会った その 映画 最後の 夜 僕は を?た あの 動画 最近の 晩 私 のこぎり 例の 映画館 続く 夜の 私は?た その映画 昨夜 を?た あの映画 ?べ その映画を?た 昨夜の映画 映画を?た 私は を?た その映画 昨夜 私は 昨夜 その映画 を?た
  • 24. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 【参考】 SMT: 翻訳?順② 翻訳?の候補(仮説)が多数、?成される I saw the movie last night 私は に会った その 映画 最後の 夜 僕は を?た あの 動画 最近の 晩 私 のこぎり 例の 映画館 続く 夜の 私は?た その映画 昨夜 を?た あの映画 ?べ その映画を?た 昨夜の映画 映画を?た 私は最後の夜その映画を?た 僕はその映画を?た昨夜 私は昨夜その映画を?た あの映画を?た昨夜 私は最近の夜のあの動画を?た 昨夜の映画に会った私は 最後の夜に会った私あの映画館 私を?たあの映画続く夜 僕はのこぎり昨夜その映画 その映画を?た最後の夜の 私は?べあの映画に会った ?語モデルも考慮し 選択
  • 25. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 25 【参考】ニューラル機械翻訳(NMT)の仕組み (原?) Complications are minimal. 合併症は最?限である。 (翻訳?) ① ?量の対訳データ (原?/訳?のペア)を収集 ②ニューラルネットワークの学習 →ノードとエッジの重みを学習 Fever is not prominent. 発熱は顕著ではない。 Clusters of cases are common. 集団の症例であることが多い。 翻訳エンジン (ニューラルネット) 原? 訳? ????? ????? ③翻訳エンジンへの搭載 NMT: Neural Machine Translation
  • 26. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 26 NMTの?所/短所 ?所 短所 ü ?い翻訳精度。特に、従来技術に?べ ?然な?章を?成する。 ü 追加学習が容易。カスタマイズがしや すい。 ü 原理が簡単。理解するハードルが下が り初学者にも優しい。 ü ニューラルネットワークのサイズは利 ?する対訳コーパスの量に依らない → 必要なメモリサイズが増えない ü うまくいく理由が?分に分かっていない。 ü 原?を過不?なくカバーして翻訳しない → 訳抜け、湧き出し、過剰?成などが起 きる ü 翻訳エラーがあった場合に修正する?法 が明確ではない。 ü 辞書を?分に制御して当てるのが難しい ü GPUマシンが必要(特に学習時) → CPUマシンでも可能だが、時間がか かってしまう
  • 27. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. ニューラルネットワークによる機械翻訳の未来 27 ? Zero-Shot Translation ? “Zero-Shot Translation with Google?s Multilingual Neural Machine Translation System” https://ai.googleblog.com/2017/08/transformer-novel-neural-network.html ? “対訳”データが不要に ? 「AI翻訳、対訳いらずに ?フェイスブックなど新技術」?本経済新聞 電?版 2018/10/28
  • 28. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 28 10年後、我々の?活は どう変わるでしょうか?
  • 29. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. VISION Make machine translation the new lingua franca to bring new life and work style across different languages by 2028. (provide English native speakers' experience to the rest.) ?語の壁を超え、新しい?活と仕事の様式をもたらす 共通語の機能を機械翻訳として2028年までに作る。 (世界のすべての?々に英語を?国語とする?々と同じ体験を与える.)
  • 30. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. TOEIC960点のアシスタントを体験 無料です? 30 https://miraitranslate.com/trial/ 「お試し翻訳」で検索? ?本語、英語、中国語、イタリア語、スペイン語、 ドイツ語、フランス語、ポルトガル語、ロシア語 がお試しできます。
  • 31. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 31 WE ARE HIRING! (主な募集職種) リードテック 機械翻訳エンジニア フロントエンド エンジニア 機械翻訳エンジン開発PM ※ポテンシャル可 バックエンド エンジニア みらい翻訳では1→10→100に向け 仲間を絶賛募集中です? SREエンジニア プロダクトプランナー アライアンス セールスマネージャー (予定) UI/UXディレクター マーケティングマネージャー (予定) カスタマーサクセス (予定) 採?担当、経理担当 (予定) 「Wantedly みらい翻訳」 で検索?
  • 32. CONFIDENTIAL ?2020 Mirai Translate, Inc. All Rights Reserved. 32 谢谢 ?? ??? ?????? Cám ?n Terima kasih Баярлалаа ?"???? ???????????? Te?ekkürler ????? Спасибо ευχαριστ? Grazie Merci Gracias Danke D?kuji Obrigado Tack Kiitos Asante ???? ????? ありがとうございました An artificial intelligence approach to translation will revolutionize your business.