狠狠撸

Statistical-independence-based efficient
initialization for nonnegative matrix factorization
総合研究大学院大学博士課程2年
国立情報学研究所/総合研究大学院大学
○北村大地
小野順貴
独立性基準を用いた非負値行列因子分解の
効果的な初期値決定法

? 非負値行列因子分解 (nonnegative matrix factorization: NMF) [Lee, 1999]
– 非負の制約条件付き次元圧縮
– 有意な特徴量を抽出する教師無し学習
– 非負性に起因するスパース分解
背景
Amplitude
Amplitude
入力データ行列
(スペクトログラム)
基底行列
(頻出スペクトルパターン)
係数行列
(時間的な強度変化)
Time
Time
Frequency
Frequency
2
: 行数（周波数ビン数）
: 列数（時間フレーム数）
: 基底数

? NMFにおける最適化問題
– 非負制約下で観測とモデルの距離（data fidelity）を最小化
– 変数及びの解析的な解は求まらず
– 効率的な反復更新式による最適化が確立されている
? 補助関数法に基づく乗法更新式 [Lee, 2001]
– 勾配法等と同じ反復更新なので全変数に初期値が必要
背景
3
距離関数が2乗ユークリッド距離の場合の乗法更新式

? 問題点: NMFを用いた全ての手法の結果はNMFの変数
（と）の初期値に依存して決まる
– 例: 全教師ありNMFによる音源分離
? 動機: 常に最良の結果をもたらす一意な初期値決定法が
望まれる
– 入力データ行列にのみ依存し，擬似乱数を用いない
問題点と動機
4
12
10
8
6
4
2
0
SDRimprovement[dB]
Rand10
Rand1
Rand2
Rand3
Rand4
Rand5
Rand6
Rand7
Rand8
Rand9
値域 [0,1] の一様な擬似乱数
をメルセンヌツイスタ法で生成
Rand1~Rand10は擬似乱数
のシードのが異なる
初期値によって精度が変わる???

? 乱数に基づく初期値決定法
– 擬似乱数そのもの（一様擬似乱数など）
– 遺伝的アルゴリズムによる良い初期値探索 [Stadlthanner, 2006], [Janecek, 2011]
– クラスタリングを用いた初期値 [Zheng, 2007], [Xue, 2008], [Rezaei, 2011]
? 入力データ行列を個のクラスタにまとめ，各クラスタのセントロイドベク
トルをNMFの初期基底ベクトルとする
? 入力データ行列のみに基づく初期値決定法
– 減算クラスタリングを用いた初期値 [Casalino, 2014]
? 擬似乱数は用いないが，2個のハイパーパラメータを調整する必要あり
– 主成分分析（PCA）を用いた初期値 [Zhao, 2014]
? 入力データ行列にPCAを適用して得られる直交基底及び係数の絶対値
を，基底行列及び係数行列の初期値とする
– 特異値分解（SVD）を用いた初期値 [Boutsidis, 2008]
? 非負二重SVD（NNDSVD）を入力データ行列に適用して得られる非負の
左及び右特異ベクトルを基底行列及び係数行列の初期値とする
従来のNMFの初期化法
5

? 直交基底はNMFにとって良い基底か否か？
– PCAもSVDも入力データ行列の直交基底を推定
– NMFの幾何学的な解釈によると [Donoho, 2003]
? “NMFにおける最良な基底は正の象限に点在する観測データ点を全て含
む凸多面錘のエッジに沿うベクトルである”
– 直交性に基づく初期値決定法はNMFに適さない可能性あり
NMFに適する基底とは
6
凸錐（convex cone）
観測データ点
エッジ
最良な基底直交する基底よりtightな基底
データの表現に必要十分で
係数はスパースになる
過剰な基底で不要な領
域を表現してしまう
観測データ点の表現
には不十分

? 入力データ行列のみから何ができるか？
– 独立成分分析（ICA）に着目
– ICAは成分間の独立性を最大化する基底（直交とは限らない）
を推定可能
– ICAは優ガウスな生成モデルを仮定することでスパースな独立
成分を推定可能
? NMFも暗にスパースな分解行列を推定（非負性に由来）
? NMFの初期値決定法としてICAを用いる
– 入力データ行列にのみ依存
– 擬似乱数もパラメータチューニングも不要
提案する初期値決定法
7

? 入力データ行列は独立成分の混合信号と仮定
– 行列中の個のソースが混合行列を経てとして観測
– ICAは分離行列とソースを推定
? これらをNMFの基底行列及び係数行列の初期値に用いる
? 「各基底に対する係数（時間的な強度変化）が独立」
– NMFは（1）非負制約条件付き（2）次元圧縮なので
? （1）2種類の非負性を考慮したICAを適用
? （2）PCAによる次元圧縮を適用※
ICAの信号モデルとNMF
8
入力データ行列混合行列（正方）ソース行列
※PCAで次元圧縮した後にICAを用いるので，従来のPCAによる直交基底の推定とは異なる
…
…
各基底の係数が
互いに独立と仮定

? Nonnegative ICA（NICA）を用いる [Plumbley, 2003]
– 全てのソースが非負となるような分離行列を推定
– 中心化せずに白色化（無相関化）された信号に対する回転行
列を求める
– 最急降下法による最適化（Fast NICAというのもある）
非負ICAを用いる提案手法（提案手法1）
9
観測信号白色化信号
白色化変換行列
（但し中心化はしない）

? 入力データの時間差分信号と通常のICAを用いる
– 非負なソースの時間差分信号が混合されていると仮定
? ソースを零平均信号とするため
– 時間差分混合信号にラプラス分布仮定ICAを適用
? ラプラス分布ICAのコスト関数は凸なのでの解は一意
? 補助関数法に基づく高速なICAの解法が提案されている [Ono, 2010]
差分信号とICAを用いる提案手法（提案手法2）
10
時間差分行列

? PCAで入力データ行列の次元を圧縮
– ソースは混合行列を経てとして観測
? 提案手法1: NICAを用いる場合
– データは，ソースは，分離信号は
– 近似的にとすると
PCAによる次元圧縮処理（提案手法1）
11
行がの固有ベクトル
はtop- 固有値に対応する固有ベクトル
固有値
大
小
NICAを用いたNMFの初期値
: 任意の行列
: 混合行列
: 零行列
: ソース行列
NICAの変数
白色化
行列

? PCAで入力データ行列の次元を圧縮
– ソースは混合行列を経てとして観測
? 提案手法2: 時間差分信号と通常のICAを用いる場合
– データは，ソースは，分離信号は
– 近似的にとすると
PCAによる次元圧縮処理（提案手法2）
12
行がの固有ベクトル
はtop- 固有値に対応する固有ベクトル
固有値
大
小
差分信号とICAを用いたNMFの初期値
: 任意の行列
: 混合行列
: 零行列
: ソース行列
この手法では反復の度に
という非負化処理を行う
NICAの変数

? いずれの提案手法においてもソースや混合行列の
推定結果が完全に非負となる保証はない
? 両変数に3種類の非負化処理のいずれかを施す
– 非負化処理1:
? 但し，とはスケールを合わせる為のスカラー
– 初期値決定法の後に用いるNMFの距離関数に応じて下記のように決まる
3種類の非負化処理
13

? ピアノの上昇音階のパワースペクトログラム
– 24音（2オクターブ）, サンプリング周波数は44.1kHz
– 行列としてのサイズは 2049x1037
実験
14
Low-rank
累積特異値のグラフ

? 提案初期化法のNICAとICAのコスト関数
– 基底数はとした例
実験
15
0.01
2
4
6
8
0.1
2
4
6
8
1
CostfunctionofNICA
2000150010005000
Iteration
100
2
3
4
5
6
7
8
9
1000
CostfunctionofICA
3020100
Iteration
提案手法1（NICA）提案手法2（差分信号＋ICA）

? 初期値を与えた後のEU-NMF
実験
16
Rand1~10 は値域 [0, 1] の一様擬
似乱数（シードが異なる）
初期値決定にかかる
処理時間例
NICA: 4.28 s
ICA: 10.77 s
PCA: 0.95 s
SVD: 1.31 s
NMF反復にかかる
処理時間例
EU-NMF: 18.39 s
(1000回反復時)

? 初期値を与えた後のKL-NMF
実験
17
処理時間例
NICA: 4.28 s
ICA: 10.77 s
PCA: 0.95 s
SVD: 1.31 s
処理時間例
KL-NMF: 62.19 s
(1000回反復時)

? 初期値を与えた後のIS-NMF
実験
18
処理時間例
NICA: 4.28 s
ICA: 10.77 s
PCA: 0.95 s
SVD: 1.31 s
処理時間例
IS-NMF: 202.96 s
(1000回反復時)

? 全教師ありNMFによる2音源分離タスク
– SiSEC2015 MUS datasetのvocalsとotherの混合
– 各音源の教師基底学習時に初期値決定法を用いる
? 分離時の係数行列は観測行列との相関を用いるため，学習時の初期値
のみによって分離性能が決まる
– 15曲の平均SDR改善量（総合分離性能）
音源分離実験
19
Rand10
NICA1
NICA2
NICA3
ICA1
ICA2
ICA3
PCA
SVD
Rand1
Rand2
Rand3
Rand4
Rand5
Rand6
Rand7
Rand8
Rand9
12
10
8
6
4
2
0
SDRimprovement[dB]
5
4
3
2
1
0
SDRimprovement[dB]
Rand10
NICA1
NICA2
NICA3
ICA1
ICA2
ICA3
PCA
SVD
Rand1
Rand2
Rand3
Rand4
Rand5
Rand6
Rand7
Rand8
Rand9
Separation performance of vocals Separation performance of other
提案手法提案手法最大で0.8 dBの差最大で1.6 dBの差
PCA SVD PCA SVD

まとめ
? NMFの効果的な初期値決定法
? 独立性基準を用いた基底（直交とは限らない）と独立成
分をそれぞれ基底行列と係数行列の初期値とする
? 非負性を考慮した2種類のICA
– Nonnegative ICA
– 時間差分信号＋ラプラス分布ICA
? NMFのコスト関数は高速により低い値まで減少
– NMFにとって良い初期値といえる
? 全教師あり音源分離タスクにおいても良好な結果をもた
らした
20

狠狠撸

独立性基準を用いた非負値行列因子分解の効果的な初期値決定法（Statistical-independence-based efficient initialization for nonnegative matrix factorization）

Recommended

More Related Content

What's hot (20)

Viewers also liked (18)

More from Daichi Kitamura (11)

独立性基準を用いた非負値行列因子分解の効果的な初期値決定法（Statistical-independence-based efficient initialization for nonnegative matrix factorization）

Editor's Notes