端端舝

@ISMB掂心頗2015
滂游藝槽
燴趙悝旃噶垀
田奶左奶件白巧穴氾奴弁旦旃噶嶱逃交瓦永玄

醴腔
? 丐月朡�赽及辻夔毛芢隅仄凶中
? 僕逃政生永玄伐奈弁毛喲砓趙(玄禾伕斥奈)
? 用奈玉肮尪及憝窣僅=☆輪今★匹䛐月
每
Mol Med Rep. 2012 Dec;6(6):1325-32
弘仿白燴� +
辻迮悝�失伙打伉朮丞 +
Gene Ontology(GO)
↙醴腔朡�赽及辻夔軑䛐

弘仿白燴�+GO label 毛瞳蚚仄凶珂俴旃噶
? + 辻迮悝�失伙打伉朮丞
每 Research in Computational Mol. Biology (2011).392每407.
每 Nat. Biotechnol (2006) 24, 1474每1475.
? + 仿件母丞它巧奈弁匹復薹汜傖
每 Bioinformatics (2014) 30 (12): i219-i227.
每 Am. J. Hum. Genet. (2008), 82, 949每958.
? + Gaphlets (用奈玉杻俶毛尨允扔皮弘仿白)
每 Cancer Inform. (2008), 6, 257每273.
每 J.R. Soc. Interface (2010), 7, 423每437.
每 Bioinformatics (2014) 30 (17): i594-i600.
? + GeneMANIA (Genome Biol. (2008), 9, S4.)
每恚杅及犯奈正末奈旦卞方月生永玄伐奈弁婬�傖

掛�恅及乒民矛奈扑亦件
? 賤昴卞云仃月掝觳ㄩ rare labels
每 ☆腴躇僅★卅失用氾奈扑亦件互綎圉杅
? 由正奈件喲堤匹汜元月綎悝�及埻秪
Fig 1. 失用氾奈扑亦件朡�赽杅<10及賃磁 (human, yeast)

rare label 尺及失皿伕奈民(珂俴旃噶)
? 仿矛伙及�侔僅卞方月眈誑娗俇
每侔凶煦赽辻夔毛手勾仿矛伙肮尪反
肮元方丹卅朡�赽午憂葆中化中月午蕉尹月
每穴伙民仿矛伙悝�卞方月辻夔眈憝及芢隅
? J. Comput. Biol (2013)., 20, 322每343
? 掝觳
每甲玄GO失用氾奈扑亦件及方丹卅
旦弗奈伙匹反�呾講卞�𡛟匹五卅中
? 腴躇僅仿矛伙反杅勀眕奻

掛�恅及ゴ旯
? Diffusion Component Analysis (DCA)
每僕逃政生永玄伐奈弁及用奈玉�侔僅 ↙
Random walks with restart(RWR) 及隅都袨颷復薹
每用奈玉杅棒啋及復薹矛弁玄伙ㄩDiffusion state
每杻釾諾嶲卞扞荌 (棒啋祅𦑩)
? 杻釾諾嶲奻及矛弁玄伙及囀搪 = �侔僅
Research in Computational Molecular Biology 9029, pp. 62每64.

丟奶件ㄩclusDCA楊
? Step1ㄩ僕逃政NW弘仿白↙杻釾諾嶲
每 DCA及蜊謎 (�呾戊旦玄祅𦑩)
? 輪侔允月乒犯伙及淏�趙�及秶廣毛�睿仄﹜
郔羥趙卞SVD(杻��煦賤)毛妏蚚
? Step2 : GO仿矛伙弘仿白↙杻釾諾嶲
每 GO仿矛伙反衄砃剠寯繚弘仿白
每杻俶毛蕉𩬅仄凶笭心葆五RWR
每 DCA反Step1午肮元
? Step3 :僕逃政NW諾嶲+GO仿矛伙諾嶲
每僕逃政矛弁玄伙 * 娗淏由仿丟奈正 = new矛弁玄伙
每肮諾嶲奻匹及囀搪 = �侔僅 ↙辻夔芢隅匹五月

Fig2. overview of clusDCA
棒啋祅𦑩
(DCA) *2
2諾嶲毛
緙磁

material
? 僕逃政NW弘仿白
每 STRING db(http://string-db.org/) v9.1
每 6勾及煦赽生永玄伐奈弁井日�慷
每用奈玉杅
? Human(16662), yeast(6311) and mouse(18248)
? GO仿矛伙弘仿白
每 GO戊件末奈扑失丞(Ashburner et al., 2000)
每 biological process (BP), MF, cellular component井日
DAG(衄砃剠寯繚弘仿白)毛�慷
每辻夔杅
? Human(13708), yeast(4240) and mouse(13807)

mathod
? 啐�
每 3-fold 弁伕旦田伉犯奈扑亦件
? 掀廌�砓
每 GeneMANIA
? http://www.genemania.org
每 DCA
? 棒啋祅𦑩摽卞kNN楊匹弁仿旦正伉件弘↙辻夔芢隅
每 HC
? 蕆𦵴弁仿旦正伉件弘毛矛奈旦卞仄凶忒楊
每 J. Bioinform. Comput. (2010) Biol., 8, 357每376.

Results: ROC (human)
? GO仿矛伙(MF,BP)毛
失用氾奈扑亦件杅匹
4煦賃(3 ~ 300)
? ヤ中田奈互clusDCA
(*反GeneMANIA午掀廌)
? yeast, mouse匹手
肮�及磐彆
Fig 3. 坻忒楊午及由白巧奈穴件旦掀廌

Results: PRC (all)
? PRC: precision
recall curve
? *反GeneMANIA午
掀廌
Table S2.(SUPPLEMENTARY Data)
坻忒楊午及由白巧奈穴件旦掀廌

Results: 帤眭及GO labels毛芢隅
Fig4. new GO 仿矛伙及憝窣朡�赽軑䛐
one-third of the GO labels as the validation set of ※uncharacterized§ labels.

仇及�恅及允仍中午仇欠
? 郔羥趙及�呾互婌中
每 STRING db及yeast生永玄伐奈弁(500棒啋)
? 翍氪日及𣶹懂楊(L-BFGS楊) : >2h
? 掛�恅 (SVD) ㄩ< 5min
每 2500棒啋匹手儕僅反邈切卅中
? 杻釾諾嶲及𡘙蚚俶互詢中
每辻夔帤眭卅朡�赽
每失用氾奈扑亦件帤眭卅GO仿矛伙
每 ∥升切日手�侔僅卞方月辻夔芢隅褫夔

娗逋ㄩDCA及失伙打伉朮丞
1) 用奈玉i井日及diffusion state
2) 郔羥趙(棒啋祅𦑩)
si
t+1
= (1- pr )si
t
B+ prei si = si
?
? Dn
wi:context feature, xi: node feature

娗逋ㄩclusDCA及失伙打伉朮丞1
1) 淏�趙�及�廣毛�睿
2) 郔羥趙 (郔苤媼�\楊)
3) GO仿矛伙弘仿白及diffusion state
log ?sij =wi
T
xj -log exp{wi
T
xj }
j
? log ?sij =wi
T
xj
diffusion state matrix L Q: a small positive constant
汐: ＆back propagation＊ parameter

娗逋ㄩclusDCA及失伙打伉朮丞2
4) 僕逃政NW弘仿白及芘荌
y∩i: projection of the gene vector xi
zij: pairwise affinity score
W: transformation matrix
W及郔羥趙宒 fj: set of genes that are positively
(negatively) annotated with function j.
X: gene vector, Y: functional vector

娗逋ㄩGeneMANIA
1. A linear regression-based algorithm that calculates a single
composite functional association network from multiple data
sources.
2. A label propagation algorithm for predicting gene function given
the composite functional association network.
http://morrislab.med.utoronto.ca/projects.html

端端舝

釵梭喝莽嗨唬插喳勳莽鳥莉掂心頗2015

More Related Content

釵梭喝莽嗨唬插喳勳莽鳥莉掂心頗2015

Editor's Notes