1. Improved Medical Education in Basic
Sciences
for Better Medical Practicing
ImproveMEd
Sustavi biologije za medicinu
IIja, Kako analizirati velike skupove podataka?
2. Sustavi biologije studije esto
zapoinju ekspresije profila
(lijekom tretiranih vs.
neobraene stanice, normalne
stanice raka, u odnosu na
stanice u razliitim razvojnom
stadiju) ... pomou mikroipa ili
RNAseq... mikropostrojima je
isplativ pristup ...
I dobili smo ovo ...
3. Mikroipa mo転e stati 10 000 mjesta. Let-a pretpostaviti da
je svaka toka je gen - kako emo organizirati mrlje / gene
kako bi izvukli rezultat?
Laserski skener mjeri jednu fluorescentnu naljepnicu od
drugog i polo転imo jedan preko drugog ... svaka toka je
mjernoged dva puta!
intenzitet fluorescentnog signala = koliina vezanog DNA
Svaka toka se mo転e zamijeniti s brojem koji predstavlja
relativnu promjenu od normalne razine.
N = R / G ... ..1 znai jednak ekspresiju u oba uzorka
R = crvena fluorescencija (tumora)
G = zeleni fluorescentni (normalnih stanica)
4. Boje se pretvaraju u brojeve, jer brojevi su lak邸e organizirati!
Svaka toka se mo転e zamijeniti s brojem koji predstavlja relativnu
promjenu od normalne razine.
R = crvena fluorescencija (tumora)
G = zeleni fluorescentni (normalnih stanica)
N = R / G
N = 1 jednaki ekspresija u oba uzorka
N> 1 indukcija
N 1 suzbijanje
http://www.hhmi.org/biointeractive/how-analyze-dna-microarray-
data
http://www.hhmi.org/biointeractive/scanning-lifes-matrix-genes-
proteins-and-small-molecules
Mo転emo usporediti s vi邸e uzoraka ...
.ili mo転emo slijediti jedan tijekom
vremena - ljudska fibroblastst
stimulirane serumom i zatim 24 sata
(Iyeret al. 1999)
I organizirati gene, tako da
inducirani jednom su grupirani
u jednom krajnje suprotno od
potisnute jednom ...
Takvo iskazivanje podataka naziva toplina karta
5. Za vaenje znanja iz velikog podataka
nam je potrebno statistike metode!
Obino koriste - R statistiki paket
LIMMA
Identificirati klastera smo limenka
koristiti - klaster analiza!
Originalni brojevi logaritmized (Po bazi
2 ili 10) i nego 邸to nastavite
izraunavanjem slinost rezultata -
pomou raunalnog programa koji prati
microarray platformu.
Za vizualni prikaz podataka skreemo
brojeve opet u bojama, ali ovaj put
zelena znai represiju i crvena znai da
indukciju.
6. Drugi nain prikazivanja
podataka vulkan zemlji邸te
(Uobiajeno GWS studija).
Podaci su prikazani u rasuli
okunica kako bi brzo prona邸li
najzanimljiviji kandidat npr gena
u nekoj bolesti.
Kombinira dva statistikih
testova: primjerice, A p
vrijednost od ANOVA modela s
veliinom promjene.
Brzo vizualna identifikacija
podataka (gena, itd) koji
prikazuju velike promjene
magnitude koje su takoer
Statistiki znaajno,
Granica
izmeu p
<0,05 i p
<0,05
Razlika izmeu istih parametara u dva uzorka prikazana kao
Puta promjene
U sivoj su promjene manje onda 2x.
http://genomicsclass.github.io/book/pages/using_limma.html
statistika znaajnost
zanimljiva podataka
7. Oboje, Toplina karta i vulkan Zemlji邸te (i statistika analiza iza
njih), prvi su korak prema identificiranju i rangiranje gena /
proteina iza primijetio fenotip. Generiranopopisi
genaOdgovoran za promatrane mehanizama ili potencijalne
mete terapije, i dalje se obrauju razliitim bioinformatika
alata.
Popis gena mogu se pohraniti u: Gen Ontologija Gene Set
Obogaivanje analiza, Transkripcija faktorske analize...
Generirano popisi moraju koristiti jedinstvena nomenklatura kako bi se
meusobno usporedivi.
8. Gene Ontologija - http://geneontology.org/
Bioinformatika alat korisna za dodjeljivanje pravo ime
u nizu i povezivanje molekularnih promjena na
stanine procese
Geni i proteini su konzervirani u veinu 転ivih
organizama i imaju zajedniki funkcije. Pronala転enje
ulogu gena u jednom organizmu mo転e pomoi
osvjetljava njezinu ulogu u drugu.Gene Ontologija
konzorcij bavi gena nomenklaturi.
Setovi su organizirani prema:
-biolo邸ki proces
-molekularna funkcija
-Cellular pretinac
Gen Ontologija konzorcij, Priroda, 2000.
Biolo邸ki proces kao 邸to su: rast stanica,
proliferacijom, prijevoda ili kamp sinteza
11. Gene set za obogaivanje analize - GSEA
Analitika metoda namijenjena pronala転enje i tumaenje
skupove gena.
U potrazi za genima koji mijenjaju zajedno
- odreivanje razine proteina koji sudjeluju u istom
signalnog puta
- u potrazi za molekule koje sudjeluju u istom biolo邸kom
procesu
Slobodni softver paket s poetnom bazom podataka od
1.325 biolo邸ki odreeni skupovi gena.
http://software.broadinstitute.org/gsea/index.jsp
Subramanian et al. (2005) PNAS 102: 15.545
1. Sortiranje geni prema kriterij npr razine ekspresije
2. Usporedite popis nekih ve postojeih popisa i dodijeliti
pojedinane gene za 'erichrichment postii'- pretjerano
predstavljene ili prekomjerno smanjenje gena prema
KolmogorovStatistika -Smirnov tipa
3. Max Obogaivanje rezultat (MES) je pokazatelj
relevantnosti postojei set gena za novi podaci postavljena
upravo pod istragom
12. transkripcijski faktor Analiza
Geni koji su promijenili razinu izra転avanja mo転e biti
regulirana na isti faktor transkripcije.
Geni su identificirani kombinacijom omics Podaci
prije i znanje.
Chea baza podataka Trenutno povezuje 159
transkripcijski faktori u vi邸e od 30.000 gena - ukupno
361 299 interakcije - izvaeni iz 157 publikacije.
TRANSFAC, PAINT, JASPAR - ostale baze podataka za
ip
kinaza Analiza obogaenje (KEA)
Web-baze command- linija softver koji povezuje
popis proteina sisavaca s proteinima kinaze koji je
vjerojatno fosforilaciju ih. The baza podataka
containes 436 kinaze i 14 374 interakcije iz 3469
publikacije,
http://amp.pharm.mssm.edu/Enrichr/
https://www.ncbi.nlm.nih.gov/pmc/articl
es/PMC2944209/
14. kromatina
imunoprecipitaciju je
metoda izbora za
pronala転enje svih
sekvenci komuniciraju
proteini. Podaci iz
sveChip-dalje Ispitivanja
se mogu davati u istoj
bazi podataka (Chea)...
https://galaxyproject.org/tutorials/chip/
15. Expression2Kinases -X2K
Softver koji kombinira razliite baze podataka i
alata.
ULAZ: popis razliito izra転enim genima
OUTPUT: proteina kinaze, Transkripcijski imbenici i
proteinski kompleksi koji su mogui sljedei
regulatori unesenih gena.
Koristei takav sotwere mo転emo konstruirati
hipotetske regulatorne puteve i izgradnju proteina
interakcije mre転e.
rezultati trebaju eksperimentalni dokaz o pojmu!
Rad-tok X2K
Chen i sur. (2012) 28 Bioinformatics: 105
16. Ono 邸to smo stvarno 転eljeti je da se transformirati
popis u mre転a - esto se koristi za sada邸nje interakcija
izmeu staninih komponenti
Euler, 1700, Sedam Mostovi Konigsberga
vor
molekula
Rub
interakcija
17. Vrste mre転a koje su relevantne za biolo邸ke sustave
1. elija Signalizacija mre転e
- Rak signalizacija mre転a
Doi: 10,1038 / psp.2013.38
2. Interakcija mre転e proteinima
- distrofin protein-protein intersctions
http: //parendogen677s10.weebly.com/protein-protein-interactions.html
3. Gene Regulatorne mre転e
- Razvoj OD Drosophila oka
http: //dev.biologists.org/content/140/1/82
20. dodatni sofwers postoje za vizualizacija i analiza mre転a:
Pajek (Vladimir Batagelj i Andrej Mrvar,, Slovenija
Ljubljana)
http://vlado.fmf.uni-
lj.si/pub/networks/doc/gd.01/Pajek2.png
http://vlado.fmf.uni-lj.si/pub/networks/doc/pajek.pdf
Cytoscape (Trey IdekerShannon et al., 2003).)
http: //www.cytoscape.org/
SNAVI (Ma'ayanet al. 2009)
yEd... ..
Identifikacija putova, podmre転e, klasteri, posebne
znaajke mre転e...
21. Molekularni podaci mogu biti
dodatno integrirana sa
strukturnim podacima kako bi se
proizvesti 3D modela
(makromolekularni kompleksi,
virtualne stanice) ....
Patwardhanet al. 2017. godine,
DOI: 10,7554 / eLife.25835
(erytrocytes zara転ena
Plasmodium)
22. 1. Statistika analiza je kritina u vaenje knowladgeo sustavu iz
velike skupove podataka. Statistikialysis generira popis gena /
proteina / RNA relevantnih za studij.
2. Popis gena mo転e se pohraniti u softveru (Alati Bioinformatika) te
u kombinaciji s prethodnim znanjem kako bi se prona邸li teorijske
novih putova, podmre転e, Regulatorni mehanizam ...
3. Integracija eksperimentalnog velikog podataka i prije znanja o
protoeDGE (Vi邸e baza podataka) omoguuje vi邸eskalne
razumijevanje fiziolo邸kih funkcija, patofiziologija ili
farmakokinetika,
4. Raunalno generirani predvianja moraju biti eksperimentalno
dokazano,