端端舝

1/25
旦矢弁玄仿伙?弁仿旦正伉件弘
龧𥱊﹛梃
駙磁旃噶湮悝埏湮悝痔尪ゴヽ 1 爛
miyazawa-a@nii.ac.jp
September 15, 2015

2/25
�辻
跪犯奈正毛萸午心卅仄ㄛ中仁勾井毛煘匹磐少午弘仿白燴�匹中丹午仇欠
及弘仿白互匹五月ㄝ今日卞煘及�I傷及萸及�侔僅卞𡛟元化ㄛ笭心毛迵尹
化支月午弁仿旦正伉件弘及�觳反笭心及苤今中ㄛ勾引曰磐太勾五及ʃ中
窒煦匹弘仿白毛ピ剿允月�觳卞䔝覂今六月仇午互匹五月ㄝ
v1 v2 v3
v4
v5
0.8
0.1
0.1
0.1
0.4
0.2
0.2
0.9
0.7
0.8

3/25
�辻
弘仿白及窣磐�婖毛魂蚚允木壬弁仿旦正伉件弘及儕僅互砃奻允月ㄝ眕狟
及�反ㄛk ⅸ歙楊匹反丹引仁中井卅中互ㄛ旦矢弁玄仿伙?弁仿旦正伉件
弘匹反ヽ渾籵曰及弁仿旦正互腕日木月瞰匹丐月ㄝ仇及�反 Murphy
(2012) 井日竘蚚仄凶ㄝ
?6 ?4 ?2 0 2 4 6
?5
?4
?3
?2
?1
0
1
2
3
4
5
k?means clustering
x
y
?6 ?4 ?2 0 2 4 6
?5
?4
?3
?2
?1
0
1
2
3
4
5
spectral clustering
x
y
ピ剿及�觳反ㄛ弘仿白燴�及煦珧匹暫卞嗣仁及旃噶磐彆互丐曰ㄛ公木日
毛妏丹仇午互匹五月午中丹瞳萸手丐月ㄝ

4/25
弘仿白午反
弘仿白反ㄛ�萸午網壬木月�砓井日卅月衄癹準諾摩磁 V 午ㄛ煘午網壬
木月�砓井日卅月摩磁 E 及瞎 (V, E) 匹丐月ㄝ煘午反ㄛV 及�卅月 2 勾
及啋及準�唗�匹丐月ㄝ煘 {vi, vj} 毛 eij 及方丹卞𤩸仁ㄝ
瞰尹壬眕狟及弘仿白毛�尨允月午狟及�及方丹卞卅月ㄝ
G = (V, E) , V = {v1, v2, v3, v4, v5} , E = {e13, e14, e24, e25, e35}
v1
v2
v3 v4
v5

5/25
俴蹈卞方月弘仿白及桶政
A = (aij) = 1E (eij) 午允木壬ㄛ弘仿白及煘及�婖毛俴蹈匹桶政允月仇
午互匹五月ㄝ仇及 A 毛蕕諉俴蹈 (adjacency matrix) 午網少ㄝ
v1
v2
v3 v4
A =
?
?
?
?
0 1 0 0
1 0 1 1
0 1 0 0
0 1 0 0
?
?
?
?

6/25
犯奈正 x1, . . . , xn 卞�萸 v1, . . . , vn 毛�𡛟今六月ㄝ2 勾及犯奈正 xi, xj
及�侔僅 sij 卞方勻化及煘 eij 卞笭心 wij ≡ 0 毛葆迵允月ㄝ仇及午五 n
棒灍�備俴蹈 W = (wij) 毛笭心葆五蕕諉俴蹈 (weighted adjacency
matrix) 午網少ㄝ
v1
v2
v3 v4
0.5
1.2 0.7
W =
?
?
?
?
0 0.5 0 0
0.5 0 1.2 0.7
0 1.2 0 0
0 0.7 0 0
?
?
?
?

7/25
弘仿白及煦賃毛蕉尹月卞丐凶曰ㄛ笭心葆五蕕諉俴蹈及坻卞ㄛ棒杅俴蹈午
中丹俴蹈手斛猁卞卅月及匹仇仇匹畿賡仄化云仁ㄝ
￤砩及�萸 vi ﹋ {v1, . . . , vn} 卞勾中化ㄛ公及棒杅 (degree) 毛
di =
n
j=1
wij
午隅戶月ㄝ棒杅毛�褒傖煦卞厥勾 n 棒淏源俴蹈 D = (di汛ij) 毛棒杅俴蹈
(degree matrix) 午網少ㄝ凶分仄汛ij 反弁伕生永市奈及犯伙正匹丐月ㄝ

8/25
笭心葆五蕕諉俴蹈午棒杅俴蹈
v1 v2 v3
v4
v5
0.8
0.1
0.1
0.1
0.4
0.2
0.2
0.9
0.7
0.8
D =
?
?
?
?
?
?
1.1 0 0 0 0
0 1.6 0 0 0
0 0 2.1 0 0
0 0 0 2 0
0 0 0 0 1.8
?
?
?
?
?
?
, W =
?
?
?
?
?
?
0 0.8 0.1 0.1 0.1
0.8 0 0.4 0.2 0.2
0.1 0.4 0 0.9 0.7
0.1 0.2 0.9 0 0.8
0.1 0.2 0.7 0.8 0
?
?
?
?
?
?

9/25
Cut 午反
升仇匹ピ剿允月井毛𢜪戶月凶戶ㄛ眕狟匹隅戶日木月講毛蕉尹方丹ㄝ
cut A, A =
(i,j) ; vi﹋A, vj ﹋A
wij (1)
仇仇匹 A = V A 匹丐月ㄝ(1) 反弁仿旦正奈 A 午 A 毛磐少笭心及駙睿匹
丐曰ㄛ仇木互苤今仁卅月方丹卞ピ剿允月及互咡引仄中午蕉尹日木月ㄝ

10/25
Cut 及瞰
A1 := {v1, v2} 午允月ㄝ
v1 v2 v3
v4
v5
0.8
0.1
0.1
0.1
0.4
0.2
0.2
0.9
0.7
0.8
cut A1, A1 = w13 + w14 + w15 + w23 + w24 + w25
= 0.1 + 0.1 + 0.1 + 0.4 + 0.2 + 0.2 = 1.1

11/25
Cut 及瞰
A2 := {v1, v2, v3} 午允月ㄝ
v1 v2 v3
v4
v5
0.8
0.1
0.1
0.1
0.4
0.2
0.2
0.9
0.7
0.8
cut A2, A2 = w14 + w15 + w24 + w25 + w34 + w35
= 0.1 + 0.1 + 0.2 + 0.2 + 0.9 + 0.7 = 2.2 > cut A1, A1

12/25
Cut 及瞰
仇及價𨃨卞反ㄛ1 勾及�萸午紹曰及�萸�窒ㄛ午中丹煦賃卞卅曰支允中
�A砃互丐月ㄝ眕狟反 A3 := {v1} 午仄凶瞰匹丐月ㄝ
v1 v2 v3
v4
v5
0.8
0.1
0.1
0.1
0.4
0.2
0.2
0.9
0.7
0.8
cut A3, A3 = w12 + w13 + w14 + w15
= 0.8 + 0.1 + 0.1 + 0.1 = 1.1 = cut A1, A1

13/25
NCut
仇及�觳毛賤𢜪允月凶戶陔仄仁 normalized cut 午中丹價𨃨毛爀⻌允
月ㄝ仇木反棒及�
NCut A, A :=
cut A, A
vol A
+
cut A, A
vol A
互苤今中幻丹互疑引仄中午允月源楊匹丐月ㄝ凶分仄
vol A =
{i ; vi﹋A}
di =
{i ; vi﹋A} {j ; vj ﹋V }
wij
匹丐月ㄝ奻匹�凶瞰卞勾中化ㄛ仇木毛�呾允月午
NCut A1, A1 =
1.1
1.1 + 1.6
+
1.1
2.1 + 2 + 1.8
=
946
1593
< 1,
NCut A3, A3 =
1.1
1.1
+
1.1
1.6 + 2.1 + 2 + 1.8
= 1 +
11
75
> 1
午卅曰ㄛ方曰歙算互午木化中月 A1 互疑引仄中午今木月ㄝ

14/25
NCut
珨啜卞 A1, . . . , Ak 卞勾中化
NCut (A1, . . . , Ak) =
k
i=1
cut Ai, Ai
vol Ai
午隅戶月ㄝ
踏引匹及�井日ㄛ弘仿白及ピ剿及�觳反棒及郔羥趙�觳卞䔝覂今六日
木月ㄝ
minimize
A1,...,Ak
NCut (A1, . . . , Ak) (2)
仄井仄ㄛ仇木反 NP 嬪褣匹丐月仇午互眭日木化中月ㄝ

15/25
弘仿白?仿皿仿扑失件
公仇匹弘仿白?仿皿仿扑失件午中丹手及毛爀⻌仄ㄛ(2) 毛屾仄𤩸五𡥼尹
月仇午毛�心月ㄝ弘仿白?仿皿仿扑失件反
L := D ? W
匹迵尹日木月ㄝ
隅膽井日允什卞眕狟及俶斮互煦井月ㄝ
L 反 n 棒灍�備俴蹈匹丐月ㄝ
L 及嘐衄� 0 午ㄛ公木卞�𡛟允月嘐衄矛弁玄伙 1 = (1 ﹞ ﹞ ﹞ 1) ﹋ Rn
毛手勾ㄝ

16/25
弘仿白?仿皿仿扑失件及俶斮
娗觳￤砩及矛弁玄伙 f ﹋ Rn
卞勾中化眕狟互傖曰蕾勾ㄝ
f Lf =
1
2
n
i,j=1
wij (fi ? fj)
2
.
偩隴
f Lf = f Df ? f Wf
=
n
i=1
dif2
i ?
n
i,j=1
fifjwij
=
?
?
n
i=1
dif2
i ?
n
i,j=1
fifjwij +
2
j=1
djf2
j
?
?
=
1
2
n
i,j=1
wij (fi ? fj)
2

17/25
弘仿白?仿皿仿扑失件及俶斮
￤砩及 A百 ? V 卞�仄化ㄛh百 := (h1,百 ﹞ ﹞ ﹞ hn,百) ﹋ Rn
毛眕狟匹隅戶月ㄝ
hi,百 :=
1A百
(vi)
﹟
vol A百
允月午眕狟互傖曰蕾勾ㄝ
h百Lh百 =
1
2
n
i,j=1
wij (hi,百 ? hj,百)
2
=
1
2
(i,j) ; vi﹋A百, vj ﹋A百
wij
1
﹟
vol A百
2
+
1
2
(i,j) ; vi﹋A百, vj ﹋A百
wij
1
vol A百
2
=
cut A百, A百
vol A百
.

18/25
�觳及婬隅宒趙
今日卞眕狟互傖曰蕾勾ㄝ
h牝Dh百 =
n
i=1
dihi,牝hi,百
=
n
i=1
di
1A牝
(vi) 1A百
(vi)
﹟
vol A牝
﹟
vol A百
=
1
﹟
vol A牝
﹟
vol A百 {i ; vi﹋A牝﹎A百}
di
= 汛牝百.
方勻化 (2) 反眕狟及方丹卞𤩸五𡥼尹日木月ㄝ
minimize
A1,...,Ak?V
tr (H LH)
subject to H DH = I
(3)

19/25
�觳及婬隅宒趙
仄井仄 (3) 反甡�午仄化 NP 嬪褣匹丐月井日ㄛH 互 Rn℅k
毛�仁手及午
允月ㄝ允卅歹切
minimize
H﹋Rn℅k
tr (H LH)
subject to H DH = I
(4)
毛賤仁仇午卞允月ㄝ
賤五支允仁允月凶戶ㄛ眕狟匹反 T := D1/2
H 午离中凶
minimize
T ﹋Rn℅k
tr T D?1/2
LD?1/2
T
subject to T T = I
(5)
毛蕉尹月ㄝ

20/25
2 棒倛宒卞憝允月祥脹宒
隅燴俴蹈 A ﹋ Cn℅n
毛巨伙立奈玄俴蹈午仄ㄛ公及嘐衄�毛竹1, . . . , 竹nㄛ
�𡛟允月嘐衄矛弁玄伙毛 u1, . . . , un, ui, uj = 汛ij 午允月 1
ㄝ仇及午五
嘐衄�卞勾中化竹1 ≒ 竹2 ≒ ﹞ ﹞ ﹞ ≒ 竹n 互傖曰蕾勻化中月卅日壬ㄛ￤砩及
q ﹋ {1, . . . , n} 午￤砩及淏�眻蝠炵 {x1, . . . , xq ; xi ﹋ Cn
, xi, xj = 汛ij}
卞�仄化
q
i=1
竹i ≒
q
i=1
xiAxi (6)
互傖曰蕾勾ㄝ今日卞 xi = ui (i = 1, . . . , q) 卅日壬ㄛ(6) 卞云中化脹瘍互
傖蕾允月ㄝ
偩隴瞰尹壬 Simovici and Djeraba (2008) 毛統桽六方ㄝ
1 巨伙立奈玄俴蹈及嘐衄矛弁玄伙反公木冗木誑中卞眻蝠允月ㄝ
竹i ui, uj = 竹iui, uj = Aui, uj = ui, A?
uj = ui, 竹juj = 竹j ui, uj
巨伙立奈玄俴蹈及嘐衄�反灍杅卅及匹竹i = 竹j 卅日壬ㄛ竹i = 竹j 午卅曰ㄛ ui, uj = 0ㄝ

21/25
郔羥趙�觳及賤
ゴ及矢奈斥及隅燴卞方曰 (5) 及賤互А戶月仇午互匹五月ㄝ勾引曰ㄛ俴蹈
D?1/2
LD?1/2
及嘐衄�毛苤今中幻丹井日竹1, . . . , 竹n 午�K屯ㄛ公木冗木
卞�𡛟允月淏�趙今木凶嘐衄矛弁玄伙毛 u1, . . . , un 午允月午五ㄛ
T = (u1 ﹞ ﹞ ﹞ uk) 午允木壬 tr T D?1/2
LD1/2
T 互郔苤卞卅月及匹丐月ㄝ
仇仇匹 zi := D?1/2
ui 午离仁午
D?1/2
LD?1/2
ui = 竹iui
D?1
LD?1/2
u = 竹iD?1/2
ui
D?1
Lzi = 竹izi
Lzi = 竹iDzi
午卅曰ㄛH = D?1/2
u1 ﹞ ﹞ ﹞ D?1/2
uk = (z1 ﹞ ﹞ ﹞ zk) 反珨啜趙今木凶嘐
衄��觳 Lz = 竹Dz 及賤毛�K屯凶手及匹丐月仇午互煦井月ㄝ

22/25
�侔僅俴蹈
失伙打伉朮丞毛畿賡允月ゴ卞ㄛ�侔僅俴蹈毛�傖允月翋猁卅 3 勾及忒楊
毛尨允ㄝ
1. 汍-neighbor
圉噤汍眕囀卞丐月萸及心卞笭心毛迵尹月ㄝ
2. k-nearest neighbor
�侔僅互詢中 k �及萸及心卞笭心毛迵尹月ㄝ�侔僅俴蹈互�備卞卅
月方丹卞蛁砩允月ㄝ瞰尹壬 vi 午 vj 互云誑中卞 k-nearest
neighbor 卞漪引木月�磁卞及心笭今毛迵尹月方丹卞允木壬方中ㄝ
3. 俇�窣磐
￤砩及 2 萸嶲及�侔僅毛�呾允月源楊匹丐月ㄝ瞰尹壬
sij = exp ?
xi ? xj
2
2考2
午仄化�呾仄化云仁ㄝ

23/25
失伙打伉朮丞
Normalized spectral clustering according to Shi and Malik (2000)
1: Construct a similarity graph.
2: Compute the graph Laplacian L.
3: Compute the ?rst k generalized eigenvectors u1, . . . , uk of the
generalized eigenproblem Lu = 竹Du.
4: Let H := (hi百) = (u1 ﹞ ﹞ ﹞ uk) ﹋ Rn℅k
.
5: Let yi := (hi,1 ﹞ ﹞ ﹞ hi,k) ﹋ Rk
(i = 1, . . . , n).
6: Cluster the points y1, . . . , yn with the k-means algorithm into clusters
C1, . . . , Ck.
媆嶲�呾講卞勾中化蕉舷允月ㄝ�侔僅俴蹈及釬傖反ㄛ俇�窣磐匹�呾仄
凶�磁 O dn2
午卅月ㄝ嘐衄矛弁玄伙及�呾反ㄛ忒楊卞方勻化綃中反丐
月手及及湮极 O n3
最僅匹丐月ㄝk ⅸ歙楊卞方月弁仿旦正伉件弘反靜
曰殿仄及隙杅毛 I 午仄化 O (Ikdn) 匹丐月ㄝ
犯奈正互�尹月午嘐衄矛弁玄伙及�呾互湮五卅�童卞卅勻化仄引丹ㄝ

24/25
袚�
旦矢弁玄仿伙?弁仿旦正伉件弘卞反中仁勾井及侔凶劐意互丐月ㄝ瞰尹壬
normalized cut 及井歹曰卞ㄛ棒及 RatioCut 毛妏丹源楊互丐月ㄝ
RatioCut (A1, . . . , An) :=
k
i=1
cut Ai, Ai
|Ai|
凶分仄 |Ai| 反 Ai 卞漪引木月�萸及杅匹丐月ㄝ
仇及旦仿奶玉反翋卞 von Luxburg (2007) 毛統蕉卞釬勻凶ㄝ�侔及坻
及忒楊支撮胍腔卅��卞勾中化反ㄛ仇及揃蹋毛統蕉卞允月午方中ㄝ

25/25
統蕉恅瓬
Murphy, K. P. (2012). Machine learning: a probabilistic
perspective.
Simovici, D. A. and Djeraba, C. (2008). Mathematical tools for
data mining. Advanced Information and Knowledge
Processing, page 129每172.
von Luxburg, U. (2007). A tutorial on spectral clustering.
Statistics and computing, 17(4):395每416.

端端舝

旦矢弁玄仿伙?弁仿旦正伉件弘

More Related Content

旦矢弁玄仿伙?弁仿旦正伉件弘