際際滷

際際滷Share a Scribd company logo
Improved Medical Education in Basic
Sciences
for Better Medical Practicing
ImproveMEd
Sustavi biologije za medicinu
IIja, Kako analizirati velike skupove podataka?
Sustavi biologije studije esto
zapoinju ekspresije profila
(lijekom tretiranih vs.
neobraene stanice, normalne
stanice raka, u odnosu na
stanice u razliitim razvojnom
stadiju) ... pomou mikroipa ili
RNAseq... mikropostrojima je
isplativ pristup ...
I dobili smo ovo ...
Mikroipa mo転e stati 10 000 mjesta. Let-a pretpostaviti da
je svaka toka je gen - kako emo organizirati mrlje / gene
kako bi izvukli rezultat?
Laserski skener mjeri jednu fluorescentnu naljepnicu od
drugog i polo転imo jedan preko drugog ... svaka toka je
mjernoged dva puta!
intenzitet fluorescentnog signala = koliina vezanog DNA
Svaka toka se mo転e zamijeniti s brojem koji predstavlja
relativnu promjenu od normalne razine.
N = R / G ... ..1 znai jednak ekspresiju u oba uzorka
R = crvena fluorescencija (tumora)
G = zeleni fluorescentni (normalnih stanica)
Boje se pretvaraju u brojeve, jer brojevi su lak邸e organizirati!
Svaka toka se mo転e zamijeniti s brojem koji predstavlja relativnu
promjenu od normalne razine.
R = crvena fluorescencija (tumora)
G = zeleni fluorescentni (normalnih stanica)
N = R / G
N = 1 jednaki ekspresija u oba uzorka
N> 1 indukcija
N 1 suzbijanje
http://www.hhmi.org/biointeractive/how-analyze-dna-microarray-
data
http://www.hhmi.org/biointeractive/scanning-lifes-matrix-genes-
proteins-and-small-molecules
Mo転emo usporediti s vi邸e uzoraka ...
.ili mo転emo slijediti jedan tijekom
vremena - ljudska fibroblastst
stimulirane serumom i zatim 24 sata
(Iyeret al. 1999)
I organizirati gene, tako da
inducirani jednom su grupirani
u jednom krajnje suprotno od
potisnute jednom ...
Takvo iskazivanje podataka naziva toplina karta
Za vaenje znanja iz velikog podataka
nam je potrebno statistike metode!
Obino koriste - R statistiki paket
LIMMA
Identificirati klastera smo limenka
koristiti - klaster analiza!
Originalni brojevi logaritmized (Po bazi
2 ili 10) i nego 邸to nastavite
izraunavanjem slinost rezultata -
pomou raunalnog programa koji prati
microarray platformu.
Za vizualni prikaz podataka skreemo
brojeve opet u bojama, ali ovaj put
zelena znai represiju i crvena znai da
indukciju.
Drugi nain prikazivanja
podataka vulkan zemlji邸te
(Uobiajeno GWS studija).
Podaci su prikazani u rasuli
okunica kako bi brzo prona邸li
najzanimljiviji kandidat npr gena
u nekoj bolesti.
Kombinira dva statistikih
testova: primjerice, A p
vrijednost od ANOVA modela s
veliinom promjene.
Brzo vizualna identifikacija
podataka (gena, itd) koji
prikazuju velike promjene
magnitude koje su takoer
Statistiki znaajno,
Granica
izmeu p
<0,05 i p
<0,05
Razlika izmeu istih parametara u dva uzorka prikazana kao
Puta promjene
U sivoj su promjene manje onda 2x.
http://genomicsclass.github.io/book/pages/using_limma.html
statistika znaajnost
zanimljiva podataka
Oboje, Toplina karta i vulkan Zemlji邸te (i statistika analiza iza
njih), prvi su korak prema identificiranju i rangiranje gena /
proteina iza primijetio fenotip. Generiranopopisi
genaOdgovoran za promatrane mehanizama ili potencijalne
mete terapije, i dalje se obrauju razliitim bioinformatika
alata.
Popis gena mogu se pohraniti u: Gen Ontologija Gene Set
Obogaivanje analiza, Transkripcija faktorske analize...
Generirano popisi moraju koristiti jedinstvena nomenklatura kako bi se
meusobno usporedivi.
Gene Ontologija - http://geneontology.org/
Bioinformatika alat korisna za dodjeljivanje pravo ime
u nizu i povezivanje molekularnih promjena na
stanine procese
Geni i proteini su konzervirani u veinu 転ivih
organizama i imaju zajedniki funkcije. Pronala転enje
ulogu gena u jednom organizmu mo転e pomoi
osvjetljava njezinu ulogu u drugu.Gene Ontologija
konzorcij bavi gena nomenklaturi.
Setovi su organizirani prema:
-biolo邸ki proces
-molekularna funkcija
-Cellular pretinac
Gen Ontologija konzorcij, Priroda, 2000.
Biolo邸ki proces kao 邸to su: rast stanica,
proliferacijom, prijevoda ili kamp sinteza
Cellular pretinac
Roditeljski
vorovi
djeca vorovi
Sustavno ime ORF
Standardna
ime gena
GO biolo邸ki proces
molekularna funkcija
stanina komponenta
Gene set za obogaivanje analize - GSEA
Analitika metoda namijenjena pronala転enje i tumaenje
skupove gena.
U potrazi za genima koji mijenjaju zajedno
- odreivanje razine proteina koji sudjeluju u istom
signalnog puta
- u potrazi za molekule koje sudjeluju u istom biolo邸kom
procesu
Slobodni softver paket s poetnom bazom podataka od
1.325 biolo邸ki odreeni skupovi gena.
http://software.broadinstitute.org/gsea/index.jsp
Subramanian et al. (2005) PNAS 102: 15.545
1. Sortiranje geni prema kriterij npr razine ekspresije
2. Usporedite popis nekih ve postojeih popisa i dodijeliti
pojedinane gene za 'erichrichment postii'- pretjerano
predstavljene ili prekomjerno smanjenje gena prema
KolmogorovStatistika -Smirnov tipa
3. Max Obogaivanje rezultat (MES) je pokazatelj
relevantnosti postojei set gena za novi podaci postavljena
upravo pod istragom
transkripcijski faktor Analiza
Geni koji su promijenili razinu izra転avanja mo転e biti
regulirana na isti faktor transkripcije.
Geni su identificirani kombinacijom omics Podaci
prije i znanje.
Chea baza podataka Trenutno povezuje 159
transkripcijski faktori u vi邸e od 30.000 gena - ukupno
361 299 interakcije - izvaeni iz 157 publikacije.
TRANSFAC, PAINT, JASPAR - ostale baze podataka za
ip
kinaza Analiza obogaenje (KEA)
Web-baze command- linija softver koji povezuje
popis proteina sisavaca s proteinima kinaze koji je
vjerojatno fosforilaciju ih. The baza podataka
containes 436 kinaze i 14 374 interakcije iz 3469
publikacije,
http://amp.pharm.mssm.edu/Enrichr/
https://www.ncbi.nlm.nih.gov/pmc/articl
es/PMC2944209/
Broj transkripcijskih faktora djeluje u isto vrijeme
na istom promotora ...
kromatina
imunoprecipitaciju je
metoda izbora za
pronala転enje svih
sekvenci komuniciraju
proteini. Podaci iz
sveChip-dalje Ispitivanja
se mogu davati u istoj
bazi podataka (Chea)...
https://galaxyproject.org/tutorials/chip/
Expression2Kinases -X2K
Softver koji kombinira razliite baze podataka i
alata.
ULAZ: popis razliito izra転enim genima
OUTPUT: proteina kinaze, Transkripcijski imbenici i
proteinski kompleksi koji su mogui sljedei
regulatori unesenih gena.
Koristei takav sotwere mo転emo konstruirati
hipotetske regulatorne puteve i izgradnju proteina
interakcije mre転e.
rezultati trebaju eksperimentalni dokaz o pojmu!
Rad-tok X2K
Chen i sur. (2012) 28 Bioinformatics: 105
Ono 邸to smo stvarno 転eljeti je da se transformirati
popis u mre転a - esto se koristi za sada邸nje interakcija
izmeu staninih komponenti
Euler, 1700, Sedam Mostovi Konigsberga
vor
molekula
Rub
interakcija
Vrste mre転a koje su relevantne za biolo邸ke sustave
1. elija Signalizacija mre転e
- Rak signalizacija mre転a
Doi: 10,1038 / psp.2013.38
2. Interakcija mre転e proteinima
- distrofin protein-protein intersctions
http: //parendogen677s10.weebly.com/protein-protein-interactions.html
3. Gene Regulatorne mre転e
- Razvoj OD Drosophila oka
http: //dev.biologists.org/content/140/1/82
Genes2Networks
Lists2Networks
kombinira eksperimentalan podataka
(mRNA izraz mikropostrojima, Genoma
邸irom CHI-X, RNAi ekrani, proteomika &
phosphoproteomics) s bacground
mre転a od svi znan interakcije (prije
biolo邸ki knowladge)
http://www.lists2networks.org
23hr
dodatni sofwers postoje za vizualizacija i analiza mre転a:
Pajek (Vladimir Batagelj i Andrej Mrvar,, Slovenija
Ljubljana)
http://vlado.fmf.uni-
lj.si/pub/networks/doc/gd.01/Pajek2.png
http://vlado.fmf.uni-lj.si/pub/networks/doc/pajek.pdf
Cytoscape (Trey IdekerShannon et al., 2003).)
http: //www.cytoscape.org/
SNAVI (Ma'ayanet al. 2009)
yEd... ..
Identifikacija putova, podmre転e, klasteri, posebne
znaajke mre転e...
Molekularni podaci mogu biti
dodatno integrirana sa
strukturnim podacima kako bi se
proizvesti 3D modela
(makromolekularni kompleksi,
virtualne stanice) ....
Patwardhanet al. 2017. godine,
DOI: 10,7554 / eLife.25835
(erytrocytes zara転ena
Plasmodium)
1. Statistika analiza je kritina u vaenje knowladgeo sustavu iz
velike skupove podataka. Statistikialysis generira popis gena /
proteina / RNA relevantnih za studij.
2. Popis gena mo転e se pohraniti u softveru (Alati Bioinformatika) te
u kombinaciji s prethodnim znanjem kako bi se prona邸li teorijske
novih putova, podmre転e, Regulatorni mehanizam ...
3. Integracija eksperimentalnog velikog podataka i prije znanja o
protoeDGE (Vi邸e baza podataka) omoguuje vi邸eskalne
razumijevanje fiziolo邸kih funkcija, patofiziologija ili
farmakokinetika,
4. Raunalno generirani predvianja moraju biti eksperimentalno
dokazano,

More Related Content

23hr

  • 1. Improved Medical Education in Basic Sciences for Better Medical Practicing ImproveMEd Sustavi biologije za medicinu IIja, Kako analizirati velike skupove podataka?
  • 2. Sustavi biologije studije esto zapoinju ekspresije profila (lijekom tretiranih vs. neobraene stanice, normalne stanice raka, u odnosu na stanice u razliitim razvojnom stadiju) ... pomou mikroipa ili RNAseq... mikropostrojima je isplativ pristup ... I dobili smo ovo ...
  • 3. Mikroipa mo転e stati 10 000 mjesta. Let-a pretpostaviti da je svaka toka je gen - kako emo organizirati mrlje / gene kako bi izvukli rezultat? Laserski skener mjeri jednu fluorescentnu naljepnicu od drugog i polo転imo jedan preko drugog ... svaka toka je mjernoged dva puta! intenzitet fluorescentnog signala = koliina vezanog DNA Svaka toka se mo転e zamijeniti s brojem koji predstavlja relativnu promjenu od normalne razine. N = R / G ... ..1 znai jednak ekspresiju u oba uzorka R = crvena fluorescencija (tumora) G = zeleni fluorescentni (normalnih stanica)
  • 4. Boje se pretvaraju u brojeve, jer brojevi su lak邸e organizirati! Svaka toka se mo転e zamijeniti s brojem koji predstavlja relativnu promjenu od normalne razine. R = crvena fluorescencija (tumora) G = zeleni fluorescentni (normalnih stanica) N = R / G N = 1 jednaki ekspresija u oba uzorka N> 1 indukcija N 1 suzbijanje http://www.hhmi.org/biointeractive/how-analyze-dna-microarray- data http://www.hhmi.org/biointeractive/scanning-lifes-matrix-genes- proteins-and-small-molecules Mo転emo usporediti s vi邸e uzoraka ... .ili mo転emo slijediti jedan tijekom vremena - ljudska fibroblastst stimulirane serumom i zatim 24 sata (Iyeret al. 1999) I organizirati gene, tako da inducirani jednom su grupirani u jednom krajnje suprotno od potisnute jednom ... Takvo iskazivanje podataka naziva toplina karta
  • 5. Za vaenje znanja iz velikog podataka nam je potrebno statistike metode! Obino koriste - R statistiki paket LIMMA Identificirati klastera smo limenka koristiti - klaster analiza! Originalni brojevi logaritmized (Po bazi 2 ili 10) i nego 邸to nastavite izraunavanjem slinost rezultata - pomou raunalnog programa koji prati microarray platformu. Za vizualni prikaz podataka skreemo brojeve opet u bojama, ali ovaj put zelena znai represiju i crvena znai da indukciju.
  • 6. Drugi nain prikazivanja podataka vulkan zemlji邸te (Uobiajeno GWS studija). Podaci su prikazani u rasuli okunica kako bi brzo prona邸li najzanimljiviji kandidat npr gena u nekoj bolesti. Kombinira dva statistikih testova: primjerice, A p vrijednost od ANOVA modela s veliinom promjene. Brzo vizualna identifikacija podataka (gena, itd) koji prikazuju velike promjene magnitude koje su takoer Statistiki znaajno, Granica izmeu p <0,05 i p <0,05 Razlika izmeu istih parametara u dva uzorka prikazana kao Puta promjene U sivoj su promjene manje onda 2x. http://genomicsclass.github.io/book/pages/using_limma.html statistika znaajnost zanimljiva podataka
  • 7. Oboje, Toplina karta i vulkan Zemlji邸te (i statistika analiza iza njih), prvi su korak prema identificiranju i rangiranje gena / proteina iza primijetio fenotip. Generiranopopisi genaOdgovoran za promatrane mehanizama ili potencijalne mete terapije, i dalje se obrauju razliitim bioinformatika alata. Popis gena mogu se pohraniti u: Gen Ontologija Gene Set Obogaivanje analiza, Transkripcija faktorske analize... Generirano popisi moraju koristiti jedinstvena nomenklatura kako bi se meusobno usporedivi.
  • 8. Gene Ontologija - http://geneontology.org/ Bioinformatika alat korisna za dodjeljivanje pravo ime u nizu i povezivanje molekularnih promjena na stanine procese Geni i proteini su konzervirani u veinu 転ivih organizama i imaju zajedniki funkcije. Pronala転enje ulogu gena u jednom organizmu mo転e pomoi osvjetljava njezinu ulogu u drugu.Gene Ontologija konzorcij bavi gena nomenklaturi. Setovi su organizirani prema: -biolo邸ki proces -molekularna funkcija -Cellular pretinac Gen Ontologija konzorcij, Priroda, 2000. Biolo邸ki proces kao 邸to su: rast stanica, proliferacijom, prijevoda ili kamp sinteza
  • 10. Sustavno ime ORF Standardna ime gena GO biolo邸ki proces molekularna funkcija stanina komponenta
  • 11. Gene set za obogaivanje analize - GSEA Analitika metoda namijenjena pronala転enje i tumaenje skupove gena. U potrazi za genima koji mijenjaju zajedno - odreivanje razine proteina koji sudjeluju u istom signalnog puta - u potrazi za molekule koje sudjeluju u istom biolo邸kom procesu Slobodni softver paket s poetnom bazom podataka od 1.325 biolo邸ki odreeni skupovi gena. http://software.broadinstitute.org/gsea/index.jsp Subramanian et al. (2005) PNAS 102: 15.545 1. Sortiranje geni prema kriterij npr razine ekspresije 2. Usporedite popis nekih ve postojeih popisa i dodijeliti pojedinane gene za 'erichrichment postii'- pretjerano predstavljene ili prekomjerno smanjenje gena prema KolmogorovStatistika -Smirnov tipa 3. Max Obogaivanje rezultat (MES) je pokazatelj relevantnosti postojei set gena za novi podaci postavljena upravo pod istragom
  • 12. transkripcijski faktor Analiza Geni koji su promijenili razinu izra転avanja mo転e biti regulirana na isti faktor transkripcije. Geni su identificirani kombinacijom omics Podaci prije i znanje. Chea baza podataka Trenutno povezuje 159 transkripcijski faktori u vi邸e od 30.000 gena - ukupno 361 299 interakcije - izvaeni iz 157 publikacije. TRANSFAC, PAINT, JASPAR - ostale baze podataka za ip kinaza Analiza obogaenje (KEA) Web-baze command- linija softver koji povezuje popis proteina sisavaca s proteinima kinaze koji je vjerojatno fosforilaciju ih. The baza podataka containes 436 kinaze i 14 374 interakcije iz 3469 publikacije, http://amp.pharm.mssm.edu/Enrichr/ https://www.ncbi.nlm.nih.gov/pmc/articl es/PMC2944209/
  • 13. Broj transkripcijskih faktora djeluje u isto vrijeme na istom promotora ...
  • 14. kromatina imunoprecipitaciju je metoda izbora za pronala転enje svih sekvenci komuniciraju proteini. Podaci iz sveChip-dalje Ispitivanja se mogu davati u istoj bazi podataka (Chea)... https://galaxyproject.org/tutorials/chip/
  • 15. Expression2Kinases -X2K Softver koji kombinira razliite baze podataka i alata. ULAZ: popis razliito izra転enim genima OUTPUT: proteina kinaze, Transkripcijski imbenici i proteinski kompleksi koji su mogui sljedei regulatori unesenih gena. Koristei takav sotwere mo転emo konstruirati hipotetske regulatorne puteve i izgradnju proteina interakcije mre転e. rezultati trebaju eksperimentalni dokaz o pojmu! Rad-tok X2K Chen i sur. (2012) 28 Bioinformatics: 105
  • 16. Ono 邸to smo stvarno 転eljeti je da se transformirati popis u mre転a - esto se koristi za sada邸nje interakcija izmeu staninih komponenti Euler, 1700, Sedam Mostovi Konigsberga vor molekula Rub interakcija
  • 17. Vrste mre転a koje su relevantne za biolo邸ke sustave 1. elija Signalizacija mre転e - Rak signalizacija mre転a Doi: 10,1038 / psp.2013.38 2. Interakcija mre転e proteinima - distrofin protein-protein intersctions http: //parendogen677s10.weebly.com/protein-protein-interactions.html 3. Gene Regulatorne mre転e - Razvoj OD Drosophila oka http: //dev.biologists.org/content/140/1/82
  • 18. Genes2Networks Lists2Networks kombinira eksperimentalan podataka (mRNA izraz mikropostrojima, Genoma 邸irom CHI-X, RNAi ekrani, proteomika & phosphoproteomics) s bacground mre転a od svi znan interakcije (prije biolo邸ki knowladge) http://www.lists2networks.org
  • 20. dodatni sofwers postoje za vizualizacija i analiza mre転a: Pajek (Vladimir Batagelj i Andrej Mrvar,, Slovenija Ljubljana) http://vlado.fmf.uni- lj.si/pub/networks/doc/gd.01/Pajek2.png http://vlado.fmf.uni-lj.si/pub/networks/doc/pajek.pdf Cytoscape (Trey IdekerShannon et al., 2003).) http: //www.cytoscape.org/ SNAVI (Ma'ayanet al. 2009) yEd... .. Identifikacija putova, podmre転e, klasteri, posebne znaajke mre転e...
  • 21. Molekularni podaci mogu biti dodatno integrirana sa strukturnim podacima kako bi se proizvesti 3D modela (makromolekularni kompleksi, virtualne stanice) .... Patwardhanet al. 2017. godine, DOI: 10,7554 / eLife.25835 (erytrocytes zara転ena Plasmodium)
  • 22. 1. Statistika analiza je kritina u vaenje knowladgeo sustavu iz velike skupove podataka. Statistikialysis generira popis gena / proteina / RNA relevantnih za studij. 2. Popis gena mo転e se pohraniti u softveru (Alati Bioinformatika) te u kombinaciji s prethodnim znanjem kako bi se prona邸li teorijske novih putova, podmre転e, Regulatorni mehanizam ... 3. Integracija eksperimentalnog velikog podataka i prije znanja o protoeDGE (Vi邸e baza podataka) omoguuje vi邸eskalne razumijevanje fiziolo邸kih funkcija, patofiziologija ili farmakokinetika, 4. Raunalno generirani predvianja moraju biti eksperimentalno dokazano,