端端舝

゜掛惤氾平旦玄秞汒磁傖及凶戶及
曆噫賜軑䛐乒犯伙及𨈘�
2020/03/16
LINE絁宒頗扦
媼衱瑤賡, 无殺哫, 刓掛�珨, 橖翩怮檔
D2-3

掖劓: 曆噫賜軑䛐 (Phrase Break Prediction)
曆噫賜軑䛐反氾平旦玄秞汒磁傖 (TTS) 扑旦氾丞毛�傖允月
奻匹秞汒及赻�俶卞敵迵允月笭猁卅猁秪及珨勾[1]
? 曆噫賜反窣適允月曆及嶲卞浲⻌今木月秞汒腔卅禾奈朮午仄化
隅膽今木﹜洘輥亢支失弁本件玄及劐趙卞方曰逃汜
? 氾平旦玄奻卞政木月掂萸及�垀眕俋卞手曆噫賜互浲⻌今木月
凶戶伙奈伙矛奈旦及忒楊匹反�𡛟互嬪褣[2]
曆噫賜卅仄曆噫賜丐曰
眭日厄嶲卞赻煦靡膽匹く廣今木﹜
趣中凶旦穴石毛嶱猾六內厜ヾ弘伙奈皿卞�冞
今六日木月秏愐氪掩漲互﹜�弊及弊鏍汜魂
本件正奈卞敵六日木化中月
2
眭日厄嶲卞/赻煦靡膽匹く廣今木﹜/
趣中凶旦穴石毛嶱猾六內/厜ヾ弘伙奈皿卞�
冞今六日木月/秏愐氪掩漲互﹜/�弊及弊鏍汜
魂本件正奈卞敵六日木化中月
曆噫賜及衄剠卞方月磁傖秞汒及赻�俶
[1] T. Fujimoto, K. Hashimoto, K. Oura, Y. Nankaku, and K. Tokuda. Impacts of input linguistic feature representation on Japanese end-to-end speech synthesis. In Proc. 10th
ISCA Speech Synthesis Workshop, pp. 166每171, 2019.
[2] P. Taylor and A. W. Black. Assigning phrase breaks frompart-of-speech sequences.Computer Speech & Language,Vol. 12, No. 2, pp. 99 每 117, 1998.

掖劓: 曆噫賜軑䛐 (Phrase Break Prediction)
゜掛惤曆噫賜軑䛐卞云中化旮𦵴悝�卞方月炵蹈軑䛐乒犯伙
支湮�耀晟惤乒犯伙及衄蚚俶互𨈘偩今木化云日內
? ゜掛惤曆噫賜軑䛐匹反CRF支仿件母丞白巧伊旦玄卅升
𣶹懂及緙�乒犯伙卞方月忒楊互𨈘偩[3]
? 荎惤曆噫賜軑䛐匹反RNN支LSTM卅升炵蹈乒犯伙卞方月忒楊互
𨈘偩今木化中月手及及湮�耀晟惤乒犯伙及�彆反帤𨈘偩[4]
? ⅲ啅正弘支�恅ロ�卅升�〝卅晟惤杻釾講卞方勻化儕僅蜊囡
? CRF伊奶乩奈支湮�耀晟惤乒犯伙及�彆反帤𨈘偩
3
[3] N. Miyazaki H. Mizuno H. Muto, Y. Ijima and S. Sakauchi. Analysis and evaluation of factors relating pause location for natural text-to-speech synthesis. In Transactions of
Information Processing Society of Japan, pp. 993每1002, 2015.
[4] V. Klimkov, A. Nadolski, A. Moinet, B. Putrycz, R. BarraChicote, T. Merritt, and T. Drugman. Phrase break prediction for long-form reading tts: Exploiting text structure
information. In Proc. Interspeech 2017, pp. 1064每1068, 2017.

醴腔: 旮𦵴悝�卞方月゜掛惤曆噫賜軑䛐乒犯伙及𨈘�
TTS卞方曰汜傖今木月秞汒及赻�俶毛砃奻今六月凶戶
�〝卅晟惤杻釾講云方太乒犯伙�婖及�彆毛𨈘偩
? ⅲ啅正弘支�恅�婖卅升及晟惤杻釾講
BiLSTM支BERT卅升及乒犯伙�婖毛𨈘偩
? 跪炵蹈及摽卞曆噫賜毛浲⻌允月井瘁井仿矛伙葆仃允月
炵蹈仿矛伉件弘及正旦弁午仄化隅宒趙
? 準曆噫賜 (<NB>) 引凶反曆噫賜 ( )午仄化仿矛伙葆仃
4
炵蹈仿矛伉件弘�觳午仄化及曆噫賜軑䛐
眭日厄嶲卞赻煦靡膽匹く廣今木 ﹜ 趣中凶旦穴石 ...
PBP classifier
<NB> <NB> <NB> <NB> <NB> <NB> <NB> <NB> <NB> <NB> <NB> ＃

犯奈正本永玄: 曆噫賜戊奈由旦
```
曆噫賜軑䛐卞蚚中月戊奈由旦午仄化CSJ, 黃赻犯奈正毛妏蚚
? CSJ反恚杅�氪卞方月屾杅及逃�井日�傖
? 黃赻戊奈由旦反�g珨�氪卞方月湮講及逃�井日�傖
? 公木冗木200立伉鏃眕奻及剠秞Е嶲毛曆噫賜午仄化庲隅
5
Train Val Test
逃�杅 157,976 1799 1729
�氪杅 2463 31 31
ⅸ歙玄奈弁件杅 38.86 36.06 34.10
ⅸ歙曆噫賜杅 3.54 3.46 3.22
CSJ云方太黃赻戊奈由旦及緙�ロ�
CSJ(恚杅�氪) 黃赻戊奈由旦(�g珨�氪)
Train Val Test
逃�杅 99,807 500 500
�氪杅 1 - -
ⅸ歙玄奈弁件杅 13.34 13.14 13.02
ⅸ歙曆噫賜杅 1.59 1.58 1.53

灍歠囀⺍
```
TTS及秞汒卞憝允月赻�俶毛砃奻今六月凶戶�〝卅
乒犯伙�婖云方太晟惤杻釾講及�彆毛𨈘偩
? 灍歠 1: 隴尨腔晟惤杻釾講卞憝允月�彆𨈘偩
? 諦紝啐�灍歠
? e.g. ⅲ啅正弘﹜�恅�婖﹜word2vec...
? 灍歠 2: 乒犯伙�婖掀廌
? e.g. BiLSTM, CRF, BERT＃
? 灍歠 3: Focal-loss云方太Fine-tuning及羥蚚
? 犯奈正煦票祥歙算�觳毛賤𢜪允月凶戶及Focal-loss
? 嗣杅�氪卞方月悝�𦤦心乒犯伙(CSJ)及黃赻犯奈正卞方月Fine-tuning
? 灍歠 4: MOS啐�云方太ABX氾旦玄
? 曆噫賜軑䛐乒犯伙毛羥蚚仄凶TTS卞方曰秞汒及赻�俶毛啐�
6

灍歠偞隅: 啐�硌㻢
```
曆噫賜及煦票反�氪黱卞湮五仁�卅月凶戶
F-汕 (汕﹋ {1.0, 0.25})旦戊失毛蚚中化軑䛐俶夔毛啐�
? 嗣杅及�氪卞羥蚚褫夔卅𡘙蚚腔卅曆噫賜軑䛐乒犯伙毛釬傖
? 悷勻凶預垀卞曆噫賜毛浲⻌允月方曰睡手浲⻌仄卅中源互
秞汒赻�俶互砃奻允月仇午互眭日木月[5]
? 恚杅�氪井日�傖今木月CSJ匹反豻煦卅曆噫賜互
浲⻌今木卅中方丹F-0.25旦戊失卞方曰precision笭�匹啐�
? �g珨�氪井日�傖今木月黃赻戊奈由旦匹反F-1旦戊失匹啐�
7
F-汕旦戊失卞方月曆噫賜軑䛐俶夔及啐�
[5] V. Klimkov, A. Nadolski, A. Moinet, B. Putrycz, R. BarraChicote, T. Merritt, and T. Drugman, ※Phrase break prediction for long-form reading tts: exploiting text structure
information,§ in Proceedings of Interspeech 2017, 2017, pp. 1064每1068.

灍歠 1: 隴尨腔卅晟惤杻釾講及掀廌𨈘�
```
゜掛惤曆噫賜軑䛐卞云中化�〝卅杻釾講及�彆毛𨈘偩
? 荎惤曆噫賜軑䛐卞云仃月旮𦵴悝�卞方月𣶹懂忒楊毛
゜掛惤曆噫賜軑䛐尺羥蚚 (2 layers BiLSTM, 512棒啋)
? 晟惤杻釾講及龰腕卞反Sudachi[6]云方太Ginza[7]毛瞳蚚
8
杻釾講棒啋杅 ��
Token 512 �g惤煦賃仄凶⻌薯恅及心毛妏蚚
+ UD 16 universal dependency 正弘毛袚樓
+ POS 48 ⅲ啅正弘(�煦�漪戈)毛袚樓
+ DEP 64 政玄奈弁件云方太笒玄奈弁件及�恅正弘云方太眈�弇离毛袚樓
+ CHAR 64 恅趼�g弇及鎚戶煋心𦵴毛袚樓
+ W2V 512 Wikipedia卞方月岈ゴ悝�𦤦心�g惤鎚戶煋心𦵴毛袚樓
ALL(UD) - UD眕俋及杻釾講毛�化妏蚚
ALL(POS) - POS眕俋及晟惤杻釾講毛�化妏蚚
灍歠卞妏蚚仄凶晟惤杻釾講
[6] K. Takaoka, S. Hisamoto, N. Kawahara, M. Sakamoto, Y. Uchida, and Y. Matsumoto. 2018. Sudachi: a Japanese tokenizer for business. In Proceedings of the Eleventh
International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki, Japan. European Language Resources Association (ELRA).
[7] 侂泬�, 湮游敃, シ埻淏倷. 傻�g弇ⅲ啅及蚚楊鐧藪俶賤𢜪午甡湔憝�S仿矛伉件弘及肮媆悝�, 晟惤�I燴悝頗菴 25 隙爛棒湮頗逃桶�恅摩, 2019.

灍歠 1: CSJ云方太黃赻戊奈由旦卞方月灍歠磐彆
```
晟惤杻釾講及袚樓卞𡛟元化F-0.25, F-1旦戊失互奻翝
? CSJ匹反UD, POS, W2V卅升及�g珨杻釾講卞云中化手�彆腔
? 黃赻戊奈由旦匹反�g珨杻釾講及袚樓卞方月�彆卅仄
? POS漪戶凶�化及杻釾講毛蚚中月仇午匹軑䛐俶夔互湮五仁奻翝
9
Precision Recall F-1 Precision Recall
Token 58.5 63.9 24.8 88.9 93.0 85.1
+ UD 61.6 65.8 30.4 89.0 90.8 87.2
+ POS 61.6 65.8 30.5 88.6 90.5 86.8
+ DEP 59.3 64.0 27.1 88.7 91.4 86.0
+ CHAR 60.1 65.0 27.1 89.4 92.1 86.8
+ W2V 60.9 66.9 24.9 87.6 91.4 84.1
ALL(UD) 62.9 67.5 30.3 89.3 91.4 87.4
ALL(POS) 63.5 68.1 30.7 90.5 91.6 89.0
CSJ云方太黃赻戊奈由旦卞方月灍歠磐彆

灍歠 2: 乒犯伙�婖及掀廌灍歠
```
�〝卅乒犯伙�婖及曆噫賜軑䛐尺及�彆毛𨈘偩
? 𣶹懂忒楊匹丐月ALL(POS)毛矛奈旦仿奶件乒犯伙午仄化妏蚚
? 悝�𦤦心BERT乒犯伙卞反＊cl-tohoku/bert-base＊[8]毛妏蚚
? BERT及跪𦵴反�卅月晟惤杻釾講毛做怱腔漪戈仇午互眭日木月[9]
? 郔皺𦵴及心毛瞳蚚仄凶BERT last午�𦵴及樓笭ⅸ歙毛
瞳蚚仄凶BERT mix及媼意�匹灍歠
? 眕狟6勾及乒犯伙�婖毛掀廌
? BiLSTM
? BiLSTM + CRF
? BERTlast
? BERTlast + CRF
? BERTmix
? BERTmix + CRF
10
[8] https://github.com/cl-tohoku/bert-Japanese.
[9] A. Rogers, O. Kovaleva, and A. Rumshisky. 2020. A primer in bertology: What we know about how bert works. ArXiv, abs/2002.12327.

```
BERTmix 矛奈旦及乒犯伙卞云中化軑䛐儕僅互湮五仁奻翝
? CSJ云方太黃赻戊奈由旦及�I氪卞云中化BiLSTM支BERTlast午
掀廌仄化軑䛐俶夔互湮五仁奻翝
? BERTlast反BiLSTM午俶夔卞幻午氏升綃中卅仄
? BERTmix毛瞳蚚允月仇午卞方曰�恅ロ�支砩庤ロ�卅升做怱腔卞
悝�今木凶晟惤杻釾講互衄�腔卞魂蚚
11
BiLSTM (Baseline) 63.5 68.1 30.7 90.5 91.9 89.0
BiLSTM + CRF 65.2 70.9 28.7 90.1 91.6 88.5
BERT last 63.9 67.3 35.3 90.8 92.2 89.5
BERT last + CRF 64.2 67.2 37.2 91.7 92.9 90.6
BERT mix 67.4 72.9 30.8 92.0 94.1 90.0
BERT mix + CRF 64.0 68.0 33.1 92.8 94.3 91.4

灍歠 3: 犯奈正煦票及祥歙算�觳尺及��I
準曆噫賜午曆噫賜及煦票云方太掀薹互湮五仁�卅月
? 準曆噫賜及杅互曆噫賜及杅方曰㇌給腔卞嗣中
? Cross entropy loss匹反�扔件皿伙毛肮脹卞㜳丹凶戶準曆噫賜卞
�允月𢖯囮互嗣仁�唸今木月�A砃
? 煦�互褣仄中曆噫賜(煦�復薹互0.5卞輪中瞰)卞�允月
軑䛐互準曆噫賜午仄化軑䛐磐彆互竘勻�日木月�A砃
? Focal-loss毛羥蚚允月仇午匹奻��觳毛賤𢜪
12
準曆噫賜杅曆噫賜杅掀薹
CSJ 5,072,106 571,458 8.875
黃赻戊奈由旦 1,185,077 161,072 7.357
準曆噫賜午曆噫賜及杅云方太掀薹

```
13
Focal-loss及�彆云方太�𡛟允月宒
犯奈正煦票及祥歙算�觳毛賤𢜪允月凶戶Focal-loss[10]毛羥蚚
? Focal-loss (FL) 卞方曰堤薯復薹及詢中扔件皿伙卞�允月𢖯囮互腴𦑩
? Balanced cross entropy(BCE)午肮�卞笭心由仿丟奈正汐
及爀⻌卞方曰犯奈正祥歙算�觳毛賤𢜪(Balanced focal-loss(BFL))
? 灍歠卞反BERTmix乒犯伙毛妏蚚
淏賤仿矛伙卞�允月堤薯復薹云方太𢖯囮
Balanced focal-loss(BFL)
Balanced cross entropy(BCE)
灍歠 3: BERT尺及Focal-loss及羥蚚云方太CSJ卞方月Fine-tuning
[10] T.-Y. Lin, P. Goyal, R. B. Girshick, K. He, and P. Doll芍r. Focal loss for dense object detection. CoRR, Vol. abs/1708.02002, 2017.

```
Balanced focal-loss (BFL)及爀⻌云方太Fine-tuning(FT)
卞方曰曆噫賜軑䛐及俶夔互湮五仁奻翝
? BFL及由仿丟奈正卞反污=2.0, 汐=0.4毛偞隅
? BFL卞方勻化堤薯復薹及詢中準曆噫賜卞�允月loss互
腴𦑩仄Precision互湮五仁奻翝
? 矛奈旦仿奶件午掀廌仄化CSJ匹反5.4禾奶件玄
黃赻戊奈由旦匹反3.5禾奶件玄及俶夔奻翝
14
BiLSTM (Baseline) 63.5 68.1 30.7 90.5 91.9 89.0
BERT mix 67.4 72.9 30.8 92.0 72.9 90.0
BERT mix + BFL(污=2.0, 汐=0.4) 68.9 78.3 23.5 93.7 75.9 92.5
BERT mix + BFL + FT(污=2.0, 汐=0.4) - - - 94.0 94.7 93.7

```
15
乒犯伙 ��
Reference 氾旦玄犯奈正毛秞汒磁傖仄凶逃�
Rule-based 掂萸及摽卞及心曆噫賜毛浲⻌仄凶逃�
BiLSTM(Token) 玄奈弁件及心妏蚚
BiLSTM(All) POS漪戈�化及杻釾講毛妏蚚
BERT mix �𦵴及樓笭ⅸ歙毛妏蚚仄凶BERT
BERT mix + BFL + FT BERTmix 卞BFL午FT毛羥蚚
MOS啐�云方太ABX氾旦玄及啐��砓
AB氾旦玄
Target A Target B
Rule-based BiLSTM (Token)
BiLSTM (Token) BiLSTM (All)
BiLSTM(All) BERT mix
BERT mix BERT mix + BFL + FT
BERT mix + BFL + FT reference
曆噫賜軑䛐乒犯伙毛爀⻌仄凶TTS乒犯伙毛秞汒及赻�俶
卞憝仄化MOS啐�云方太AB氾旦玄卞方曰啐�
? 黃赻戊奈由旦卞方曰��今木凶曆噫賜乒犯伙毛�砓卞啐�
? TTS乒犯伙卞反FastSpeech2[11] + Parallel WaveGAN[12]毛妏蚚
? 25�及掩歠氪互跪乒犯伙卞�仄化30逃�啐�
灍歠 4: 翋紝啐�灍歠
[11] Y. Ren, C. Hu, T. Qin, S. Zhao, Z. Zhao, and T.-Y. Liu. FastSpeech 2: Fast and high- quality end-to-end text-to-speech. In Proc. ICLR (in press), 2021.
[12] R. Yamamoto, E. Song, and J.-M. Kim. Parallel WaveGAN: A fast waveform generation model based on generative adversarial net- works with multi-resolution spectrogram.
In Proc. ICASSP, pp. 6199每6203, 2020.
MOS啐�及�砓乒犯伙 ABX氾旦玄及�砓乒犯伙矢失

```
16
乒犯伙腕萸
Rule-based 3.72 ㊣ 0.07
BiLSTM(Token) 3.89 ㊣ 0.07
BiLSTM(All) 3.86 ㊣ 0.07
BERT mix 3.91 ㊣ 0.07
BERT mix + BFL + FT 3.95 ㊣ 0.07
Reference 4.06 ㊣ 0.07
MOS氾旦玄卞方月灍歠磐彆(95%陓螸Е嶲)
枑偶忒楊匹丐月BERTmix + BFL + FT卞云中化Reference
毛壺仁6勾及乒犯伙及笢匹秞汒及赻�俶互郔手奻翝
? 秞汒及赻�俶卞憝仄化1萸井日5萸匹啐�
? BERTmix矛奈旦及乒犯伙午公及坻及乒犯伙及嶲卞衄砩船衄曰
? BERTmix午BERTmix + BFL + FT及嶲卞反衄砩船剠仄
灍歠 4: MOS啐�卞方月灍歠磐彆

```
17
Target A Target B A B Neutral
Rule-based BiLSTM(Token) 0.173 0.455 0.372
BiLSTM(Token) BiLSTM(All) 0.200 0.211 0.589
BiLSTM(All) BERT mix 0.215 0.221 0.564
BERT mix BERT mix + BFL + FT 0.136 0.112 0.739
BERT mix + BFL + FT reference 0.157 0.260 0.583
AB氾旦玄卞方月灍歠磐彆
BERTmix + BFL + FL方曰BERTmix 毛腢亼允月賃磁詢
? 2勾及秞汒及丹切升切日及秞汒互方曰赻�匹丐月井
引凶反肮元匹丐月井腢亼
? BERTmix矛奈旦及乒犯伙卞云中化公及坻乒犯伙方曰赻�俶奻翝
? BERTmix午BERTmix + BFL + FT及嶲匹Neutral毛腢亼允月賃磁詢
灍歠 4: AB氾旦玄卞方月灍歠磐彆

灍歠 4: 翋紝啐�灍歠卞瞳蚚仄凶扔件皿伙瞰1
```
18
Reference
丟平扑戊匹反 鎊犿躇仫瞎�卞噐漲今木凶�及 ピ剿朡极互 耋繚
蕣卞离五�曰卞今木月仇午互嗣中
Rule-based
丟平扑戊匹反鎊犿躇仫瞎�卞噐漲今木凶�及ピ剿朡极互耋繚蕣卞离五�曰卞今木
月仇午互嗣中
BiLSTM(Token)
丟平扑戊匹反 鎊犿躇仫瞎�卞噐漲今木凶�及ピ剿朡极互耋繚蕣卞 离
五�曰卞今木月仇午互嗣中
BiLSTM(All)
丟平扑戊匹反 鎊犿躇仫瞎�卞噐漲今木凶�及ピ剿朡极互耋繚蕣卞离五�曰卞
今木月仇午互嗣中
BERT mix
丟平扑戊匹反 鎊犿躇仫瞎�卞噐漲今木凶 �及ピ剿朡极互 耋繚
蕣卞离五�曰卞今木月仇午互嗣中
BERT mix + BFL + FT
丟平扑戊匹反 鎊犿躇仫瞎�卞噐漲今木凶�及ピ剿朡极互 耋繚蕣卞离
五�曰卞今木月仇午互嗣中

引午戶
```
秞汒及赻�俶毛砃奻今六月凶戶曆噫賜軑䛐卞云中化
�〝卅晟惤杻釾講云方太乒犯伙�婖及�彆毛𨈘偩
? BERT矛奈旦及乒犯伙毛瞳蚚允月仇午卞𣶹懂忒楊方曰俶夔奻翝
? 曆噫賜軑䛐卞云中化BERT卞方月做怱腔卅晟惤杻釾講互
BiLSTM卞方月隴尨腔卅晟惤杻釾講方曰�彆湮
? 郔皺𦵴及心毛瞳蚚仄凶BERT last方曰�𦵴及樓笭ⅸ歙毛瞳蚚仄凶
BERT mix及源互俶夔砃奻卞敵迵
? 曆噫賜軑䛐乒犯伙及俶夔砃奻卞方曰秞汒及赻�俶手肮媆卞砃奻
? Focal-loss及爀⻌卞方曰F-汕旦戊失及奻翝反復庲匹五凶手及及
秞汒及赻�俶卞憝仄化反衄砩船剠
19

端端舝

゜掛逄氾平旦玄秞汒磁傖及凶戶及曆噫賜軑聆乒犯伙及𨈘枒

Recommended

More Related Content

What's hot (20)

Similar to ゜掛逄氾平旦玄秞汒磁傖及凶戶及曆噫賜軑聆乒犯伙及𨈘枒 (20)

゜掛逄氾平旦玄秞汒磁傖及凶戶及曆噫賜軑聆乒犯伙及𨈘枒