20. 1 2 3 4 5
0
20
40
60
80
100
MOS on naturalness
Correctrate[%]on
speakersimilarity
Target
Source
Baseline
良い
良い
A
B
C
D
E
F
G
H
I
J
K
LM
N
O
P
Q
? 統計的音声変換手法の性能比較には共通の音声データセットを用いた
評価が必要不可欠
? Voice Conversion Challenge 2016 の開催 [Toda et al., 2016]
? タスク:話者変換(5話者?5話者,162文対で学習,別の54文を評価)
? データセット:DAPS [Mysore, 2015] を利用
? 参加チーム数:17
? 中国:4
? 日本:3
? インド:3
? 英国:2
? 香港:1
? 台湾:1
? シンガポール:1
? スペイン:1
? 米国:1
B.手法の評価
4.課題と展望:3
21. 1 2 3 4 5
0
20
40
60
80
100
MOS on naturalness
Correctrate[%]on
speakersimilarity
Target
Source
Baseline
良い
良い
A
B
C
D
E
F
G
H
I
J
K
LM
N
O
P
Q
? 統計的音声変換手法の性能比較には共通の音声データセットを用いた
評価が必要不可欠
? Voice Conversion Challenge 2016 の開催 [Toda et al., 2016]
? タスク:話者変換(5話者?5話者,162文対で学習,別の54文を評価)
? データセット:DAPS [Mysore, 2015] を利用
? 参加チーム数:17
? 中国:4
? 日本:3
? インド:3
? 英国:2
? 香港:1
? 台湾:1
? シンガポール:1
? スペイン:1
? 米国:1
B.手法の評価
正解率 = 75%
MOS = 3.5
4.課題と展望:3
22. 1 2 3 4 5
0
20
40
60
80
100
MOS on naturalness
Correctrate[%]on
speakersimilarity
Target
Source
Baseline
良い
良い
A
B
C
D
E
F
G
H
I
J
K
LM
N
O
P
Q
? 統計的音声変換手法の性能比較には共通の音声データセットを用いた
評価が必要不可欠
? Voice Conversion Challenge 2016 の開催 [Toda et al., 2016]
? タスク:話者変換(5話者?5話者,162文対で学習,別の54文を評価)
? データセット:DAPS [Mysore, 2015] を利用
? 参加チーム数:17
? 中国:4
? 日本:3
? インド:3
? 英国:2
? 香港:1
? 台湾:1
? シンガポール:1
? スペイン:1
? 米国:1
B.手法の評価
正解率 = 75%
MOS = 3.5
4.課題と展望:3