端端舝

樵隅躂

𡌂儔湮悝 ʊ疑倯珩

1

樵隅躂
? 樵隅躂午反﹜犯奈正及杻釾講毛蚚中凶��g卅伙奈伙匹煦嶊毛
釬曰﹜杻釾諾嶲毛煦賃允月仇午毛籵元化瓚�e支隙䔝毛俴丹乒
犯伙及仇午
? 乒犯伙及意�ㄩCART支C4.5(C5.0)
? CART
1. 躂及�慷ㄩ睡日井及價𨃨毛㦤凶允引匹﹜軑戶隅膽仄化云中凶戊旦玄卞價
勿中化杻釾諾嶲毛2煦賃允月忒適五毛靜曰殿允
2. 熟隅(pruning)ㄩ�慷今木凶躂及旮今互旮中幻升恚螝卅犯奈正毛㜳丹仇
午互匹五月互﹜綎悝�及褫夔俶互丐月﹝公仇匹﹜綎悝�毛滅什凶戶﹜軑
戶隅戶化云中凶由仿丟奈正卞方勻化乒犯伙及恚螝僅毛秶郘允月仇午

? 瞳萸ㄩ詢棒啋及瓚�e互⺍眢卞��腔卞復庲匹五月

2

樵隅躂及奶丟奈斥
伙奈玄用奈玉
�倛隙䔝

正奈立瓜伙用奈玉

3

煦�及蕉尹源

煦�及蕉尹源
? 瞰尹壬﹜丐月妀ⅲ毛�⻌允月井瘁井毛郔手謎仁掊隴允月煦�毛釬傖允
月午允月﹝仇及媆﹜煦�今木凶犯奈正互惁丹﹜惁歹卅中匹五木中卞煦仃
日木木壬﹜公木反☆��匹丐月★午今木月﹝
? 煦�卞方曰﹜�趙仄化中仁釬𦲀互樵隅躂

4

樵隅躂及忒楊

? CART(Classification And Regression Trees)
? 祥�僅毛桶允GINI�S杅毛價𨃨卞煦賃
? 用奈玉毛煦嶊今六月仇午卞方勻化﹜祥�僅互𦑩屾允月ㄗˊ煦嶊
摽及公木冗木及用奈玉及�僅互�允ㄘ方丹卅煦嶊萸毛抻允
? ☆�僅互�允★ˊ☆田仿汁平互屾卅仁卅月★

? C4.5(C5.0)
? 巨件玄伕疋奈卞價勿仁必奶件掀午中丹價𨃨匹煦賃

5

躂及�慷戊旦玄
? 躂及�婖T﹜m楓醴及正奈立瓜伙用奈玉? ? ﹜ ? ? 笢及瞰觳杅
??
? ? ? 卞云中化﹜仿矛伙互g卞卅月復薹
1
? ?,? = ?[? ? = ?]
? ?
? ? ? 卞云仃月仿矛伙及軑䛐
?(m) = argmax ? ? ?,?

? T卞云仃月用奈玉m及戊旦玄? ? (?)
1. 斥瓦�S杅 ? ? ? = ? ?,? ? ?,?∩ = ? ?,? (1 ? ? ?,? )

?
2. 巨件玄伕疋奈 ? ? ? = ?=1 ? ?,? ???? ?,?

6

斥瓦�S杅午巨件玄伕疋奈

? 斥瓦�S杅匹煦�
? 祥ⅸ脹今毛尨允硌㻢 0~1及嶲及�毛龰曰﹜0匹ⅸ脹
? 斥瓦�S杅互郔手腴狟允月方丹卞煦�允月﹝

? 巨件玄伕疋奈卞價勿仁必奶件ㄗロ�瞳腕ㄘ掀
? ロ�講毛䛐月硌㻢ㄗ昜燴匹反骺支昜斮及�汃僅毛尨允硌㻢ㄘ
? ロ�講ㄩ復薹p匹お仇月岈砓及ロ�講反ㄜ???2 ? 匹隅膽今木月
? ???2 ?及羯��互湮五中ˊロ�講互嗣中
? 巨件玄伕疋奈ㄗㄜ ? ? ?,? ???? ?,? ㄘ互腴中幻升用奈玉及�僅反詢中
?=1

7

斥瓦�S杅午巨件玄伕疋奈ㄩ諒褪𤩸及瞰
�极匹200�及瞰觳互湔婓﹜公木冗木弁仿旦互2勾

煦賃1 ?1 卞弁仿旦1互75�﹜弁仿旦2互25�
?2 卞弁仿旦1互75�﹜弁仿旦2互25�

煦賃2 ?1 卞弁仿旦1互50�﹜弁仿旦2互100�
?2 卞弁仿旦1互50�﹜弁仿旦2互0�
100 75 75
斥瓦�S杅煦賃1 (1? ) ℅2 = 0.1875
200 100 100
150 50 50 50 50 50
煦賃2 (1? ) + (1? ) = 0.1666
200 150 150 200 50 50

100 75 75
巨件玄伕疋奈煦賃1 ℅log( ) ℅2 = ㄜ1.5
200 100 100
150 50 50 50 50 50
煦賃2 ℅log( ) + ℅log( ) = ㄜ0.3962
200 150 100 200 50 50

蛁砩ㄩC4.5卅升反巨件玄伕疋奈卞價勿仁必奶件ㄗロ�瞳腕ㄘ掀毛蚚中月
8

樵隅躂 in R
library(rpart) ; library(mlbench)
data(Glass)
nrow(Glass) # ↙ 214
head(Glass) # 9勾及犯奈正午7勾及Type
table(Glass$Type) # 跪Type及�杅

set.seed(1) # 觴杅及意毛硌隅
# 悝�犯奈正
tra.index <- sample(nrow(Glass), nrow(Glass)*0.7) # 仿件母丞扔件皿伉件弘

# 斥瓦�S杅匹悝� split= ※information§ 匹巨件玄伕疋奈
res <- rpart(Type~., Glass[tra.index,], method=※class§, parms=list(split=※gini§))

pred <- predict(res,Glass,type=※class§) # 仿矛伙及軑䛐

mean(pred[tra.index]!=Glass$Type[tra.index]) # ��悷船瓚�eけ毛�傖允月蕣及悝�犯奈正及悷曰薹
mean(pred[-tra.index]!=Glass$Type[-tra.index]) # 軑䛐悷船帤眭及犯奈正卞�允月悷曰薹

# 樵隅躂及桶尨
plot(res);text(res)

9

躂及熟隅(pruning)
? 躂T＊毛�慷仄凶媆﹜T?T＊毛T＊毛熟隅允月仇午匹腕日木月窒煦
躂(subtree)午允月
?
? 窒煦躂T及戊旦玄 ?汐 (T) = ?=1 ? ? ? ? (?) + 汐 ?
? ㄩ正奈立瓜伙用奈玉及�杅
汐ㄩ熟隅毛秶郘允月由仿丟奈正
? 悝�犯奈正及羥𡛟僅午汐及湮五今反玄伊奈玉左白
? ?0 (T)尺及敵迵互苤今卅用奈玉井日�卞熟隅毛俴丹
↙ ?汐 (T)毛郔苤卞允月窒煦躂?汐毛抻坰允月

? R匹反汐匹反卅仁左皿扑亦件cp毛蚚中月
? ?? (T) = ?0 (T) + cp ? ?0 (?0 ), 0汨 c 汨 1
10

躂及熟隅午躂及旮今

4

悝�犯奈正及羥𡛟僅

凶分仄﹜灍蕣卞反cp沖2匹1勾分仃及煦嶊午卅月

11

𢖯囮俴蹈午岈ゴ復薹
? 弁仿旦仍午及扔件皿伙杅卞方勻化悷瓚�e及笭今互�卅月

>table(Glass$Type) Glass及犯奈正反酘及方丹卞卅勻化中月﹝
1 2 3 5 6 7 斗尹卞﹜扔件皿伙杅互屾卅中弁仿旦匹丐月3,5,6
70 76 17 13 9 29 毛悷瓚�e允月戊旦玄反苤今中﹝

[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 0 1 100 100 100 1
[2,] 1 0 100 100 100 1
公仇匹﹜酘�及方丹卅𢖯囮憝杅毛爀⻌仄﹜3,5,6
[3,] 1 1 0 100 100 1
[4,] 1 1 100 0 100 1 及悷瓚�e及戊旦玄毛100捷卞仄化心月
[5,] 1 1 100 100 0 1
[6,] 1 1 100 100 100 0

0.1666667 0.1666667 ＃
引凶由正奈件庲舑及掛匹反珨�煦票毛�隅仄凶
煦昴手磁歹六化俴勻化中月
13

𢖯囮俴蹈午岈ゴ復薹 in R
library(rpart) ; library(mlbench)
data(Glass)
set.seed(1)
tra.index <- sample(nrow(Glass),nrow(Glass)*0.7)

# 𢖯囮俴蹈
LOSS <- matrix(1,length(levels(Glass$Type)), length(levels(Glass$Type)))
LOSS[,c(3:5)] <- 100 ; diag(LOSS)<-0

# 悝�
res2 <- rpart(Type~., Glass[tra.index,], method="class", parms=list(loss=LOSS))
yhat2 <- predict(res2,Glass,type=※class§) # 仿矛伙及軑䛐
mean(yhat2[tra.index]!=Glass$Type[tra.index]) # ��悷船
mean(yhat2[-tra.index]!=Glass$Type[-tra.index]) # 軑䛐悷船
table(true=Glass$Type, prediction=yhat2) # 瓚�e磐彆

# 珨�煦票及�磁↙parms=list(prior=rep(1/6,6)

14

岈ゴ復薹卞珨�煦票毛�隅仄凶�磁

15

樵隅躂及祥假隅俶

? 樵隅躂及�觳萸
? 瓚�e磐彆及煦汃互湮五仁﹜犯奈正互屾仄劐歹勻凶分仃匹�慷今木月
躂及�婖支瓚�e伙奈伙互湮五仁劐歹勻化仄引丹﹝
? 14梒匹㜳丹田幼件弘脹匹躂及假隅俶毛䛐勻化中月﹝

16

端端舝

由正奈件庲舑菴10梒樵隅躂

Recommended

More Related Content

What's hot (20)

Viewers also liked (20)

Similar to 由正奈件庲舑菴10梒樵隅躂 (20)

由正奈件庲舑菴10梒樵隅躂

端端舝

由正奈件庲舑 菴10梒 樵隅躂

Recommended

More Related Content

What's hot (20)

Viewers also liked (20)

Similar to 由正奈件庲舑 菴10梒 樵隅躂 (20)

由正奈件庲舑 菴10梒 樵隅躂

由正奈件庲舑菴10梒樵隅躂

Similar to 由正奈件庲舑菴10梒樵隅躂 (20)

由正奈件庲舑菴10梒樵隅躂