�ݺ�ߣ

MODUL 6 GENE PREDICTION
Modul A
GENE PREDICTION IN PROKARYOTES
1. Buka halaman www.softberry.com
2. Klik link OPERON AND GENE FINDING IN BACTERIA yang ada di bagian kiri, lalu pilih FGENESB.
3. Copy dan paste sekuen ke kotak isian
>gi|148717999|gb|CP000672.1| Haemophilus influenzae PittGG, parsial
GTTAAATTTGCCAATCAATTTGTGGATATTATTGAACTTCCACTTCCTAAAAATAAAAAATATCCAATTG
AGGGATGGGAACATATTGAGATTGTAATGCCATTTTTACCGAAAGAATCGATAAATGAATGGATTAACCG
TGTTAATATGTATTTTTTATGGGACAAATTAACTCAATTAACCATTAAAGTGAGCGAGCCTAAAGTGGAT
GGGGAAAGATTACCAAATCCATCTATTGCAGTAAGTTTTACGGATAAAACAGTAAATCATACTTGCATTA
AGGTTCATCCTTATTCTATAAAAAAATACTTGAGGTTTAGTAAAAATGAATAAATTATCACTTGCATTCG
TTGTTTAGCAACAGTAGACTTGAGTGCTTGTTCTGCCCTTCAAAAGGGGGAGGGGACTTATAAAGGTCAA
ATTATTTTTAGTCAAATGGAAGGCAAAAATCTAAAATTAACTGTTCGTAAAAATGATTGTTCTGGTAACC
AGCAGAAAGGAGAGGAAGTTGTTATTGTGCATAAGTATGATTCAACTTTAGTTGTTGGTGCTTGTGTTTT
AGTATCTGACAATGGTAATACTAAAGACATTTCAACTTTTTCTCCAAGAAACCCACTTTAATTCCTTCTA
ATATAGAGAATATTATATGAAAAAAACAAATATGGCATTAGCACTGTTAGTTGCTTTTAGTGTAACTGGT
TGTGCAAATACTGATATTTTCAGCGGTGATGTTTATAGCGCATCTCAAGCAAAGGAAGCGCGTTCAATTA
CTTATGGTACGATTGTTTCTGTACGCCCTGTTAAAATCCAAGCTGATAATCAAGGTGTAGTTGGTACGCT
TGGTGGTGGAGCTTTAGGTGGTATTGCTGGTAGTACAATTGGCGGTGGTCGTGGTCAAGCTATTGCAGCA
GTAGTTGGTGCAATTGGCGGTGCAATAGCTGGAAGTAAAATCGAAGAAAAAATGAGTCAAGTAAACGGTG
CTGAACTTGTAATTAAGAAAGATGATGGTCAAGAGATCGTTGTTGTTCAAAAGGCTGACAGCAGTTTTGT
AGCTGGTCGCCGAGTTCGTATTGTTGGTGGCGGCTCAAGCTTAAATGTTTCTGTGCTATAACCAATAGCA
TTAAAGTCTAATATGATTAATCAGTGTCTTAACTTAGTAAGGCACTGATTTTTTATAATTAAATTCATTT
AAAATATATATTTATCGTCTATCTAAGATAAATTTAAAGGACTAAATTAGAATTTAGTCCTTTTAGACAA
ACTTGGAATTTGTTCCCCTTTCTGAACACTCTATCTAAAATATAACATTTATTTTTCTTATGAACTTTTT
TATAATCTTTAAATTTTGCTTTAAATCAAATAATTCAAGATGATATTTAATAAAATGTAAGAGTGAAGTT
ATAGTATATTTATCTAAGCTCATATACATCTCATAAAGTATACTTTTCAACACTTTATTACTTTTATCCA
CATGATATATTTCTAGCAACGACACACTATTAATTACTTTTATATCTATACCTATCTTATTAAGGTAATA
TGTAATATTTTCCTCTTTATCTTTTTAGCTACCTCATTTGCTTATGATTATAAACTGATGATGTTTGGTT
TCCATGTAGTCTATATTTTACCAATGCTTCAGGATAATTAGCTAAACAACCAAGCCTACTAACCTCTGAC
CAAAACTTATAATCTTCTGCATACGGATAATCTTTATTAAAGATTAATTTATGCTCTCTATATACATTTG
CTCTCATAATCATAGTGTTGTTATGTATCGGATTATAGAAAAGCATAGCTTCACAAATATCATTATGTAG
CAATGGATTTTTCCATATATCACCAGTTTTATATTTAGAACCGATAATGCCACATTCTTTTTCTACAATA
ATCTCTAAGTATGATCCCATTGCTGTAATATGATCATTTTTCTCCAGATAGGTAACTATTTTCTCAATCC
ACGATGGTTTAGCTATATCATCAGCATCCATTCTTGCAAAATATTTACCTGAAAAACAACCAAGGCCTAT
ATTCAAAGAATTTATGAACCCTAAATTATATTTATTACTGATAATTTTTATCCTTTTATCTAATTTAGAT
ATTTCTTCTAAATGAGACAAAGTCAAATCTGTTGAACCATCATTGATAACTATAATTTCTAGATTTTTAT

AAGTCTGATTAATAATGGATGAAATGCTTTCATCTATATATTGCTCAGCGTTATAAGCACAAAAAATAAC
CGATACTAATGGGAAATTTTCCATATAAGCTCTAATTTTACACTCTTCTTTAAACTATTTTATACGTTAT
TTAAATAACAAAAGGAGATGCATAGATAACCAATTAAAACTCTCCTAAATTAATTGTTTTGAAATAGAAA
TTTGAGTTTTTTTAAATCACTATGATTAAAACGCCATTCATATTCCTTTAAAAATAGCTTAAGAATATCA
TAACCTCTGTAGAAATTCATATAAACAATACTACCTTGTTTACCTTTTCTCGAATAATCGGTAACAGTGT
TGCAGATTGCATATTCATAACCACCACGGTGTATACTTTGCCATTTCGTTTCAAAAAACAAATTACGAAG
TTTTTCCAGCTTCTCCTTGACCAAGTTTACCTTTCAGAGCACCACCAAAATAGCTTTCATTCGCTTGAAT
TTCACCTTCAAACATTTCCATATGTAGGCTGCTTTGAGTGATAAATAATGGTAGACGATGAAAGTAATAA
GCTGAAGTTTATTTATATTTACCAACTTAGCTGCAGCTAGAGCTGTCACACTTGCCAGAAATATCTCAAT
AAGTTTATTTTGCTTATATTGACTTAAGCGACTTTCTCTCATTTGATTATCTTAACCTAAATAGAGTTTT
TAGTCGTTATCTGTGACAGCTCTAGAATTATTCAAATCCAAATAATTAACGCCATGTTTTAAATTGATTG
ATTAATCCATTTGTTGAACTATCGTGGCTTGCGACTTTTTCAGAATCGGTTAATTCAGGAAGAATTCTGT
TTGCAAGTTGTTTGCCTAGCTCTACGCCCCATTGATCGAAGCTAAAGATATTAAAAATCACACCTTGTAC
GAAGATTTTGTGTTCATACATAGCAATTAATGCACCCAAGGTAAATGGCGTGATTTTTTGAACGAGAATA
GAATTAGTTGGCTTATTACCCGTAAATACTTTAAATGGAACGATATTTTTTACATCATCTAAAGATTTAC
CCGCTTTTATAAATTCAGCCTCGACTTCTTCTTTTGTTTTTCCGAATGCTAATGCTTCTGTTTGTGCAAA
GAAGTTTGAAAGCAATTTATTGTGATGATCCGCCAATGGATTGTGGCTTTGGGCTGGTGCGATAAAATCA
CAAGGAATTAAAGTGGTGCCTTGATGAATTAATTGATAGAACGCGTGTTGTCCATTTGTACCTGGTTCTC
CCCAAATGATAGGGCCAGTTTGATAATTGTTAATGACATTGCCATCACGATCCACATATTTACCATTTGA
TTCCATATTACCTTGTTGAAAATAAGCTGCGAAGCGATGTAAATATTGATCATAAGGTAAGATCGCTTCT
GTTTGTGCACCAAGGAAATTGGTATTCCATAAACCAACTAATGCTAAAGTAGTTGGGATATTTTGTTCGA
TTGGAGTAGAGCGGAAATGTTTATCCATTTCATGCGCGCCATTTAATAACGCTTCAAAGTTTTCAAAGCC
AATTGATAGTGCAATTGAAAGACCAATAGCTGACCATAAAGAGTAACGACCGCCAACCCAATCCCAAAAT
TCAAACATGTTATTGGTATCAATGCCAAATTTTTCTACATCTTTAGCATTGGTTGATAATGCTGCAAAAT
GTTTTGCAACTGCACTTTCATCTTTCGCTGCTTTTAGTAACCAATCACGCGCACTTTGCGCATTTGTCAT
GGTTTCTTGAGTTGTAAAAGTCTTAGATGCCACTAAGAAAAGAGTGGTTTCTGGATTGACTTTTTTTAAG
GTTTCTGCAATGTGTGTACCATCGACATTTGAAACAAAGTGCATATTTAAGTGATTTTTATATGGGCGAA
GCGCTTCGGTTACCGTATAAGGGCCTAAGTCAGAGCCACCAATACCAATATTCACAACATCCGTAATGGC
TTTGCCTGTATAGCCTTTCCATTCGCCAGAAATAATACGCTGACAGAAATCTTTCATTTTAGCTAACACA
GCATTGACTTCAGGCATAACATCTTTACCATCAACAAGTACTGGCGTATTAGTGCGATTGCGAAGTGCAG
TATGCAGCACGGCACGATTTTCTGTACGATTGATTTTTTCGCCAGTAAACATCGCTTCTTTTGCACTATC
AAGCGCGCATTCTTGAGCAAGTTGGCGAAGATGTGAAAGGGTTGTTTGATTGATGTTGTTTTTGGAAAAA
TCGACAAGAATTTGGTTATTGAATGTTAAAGAATAATCGTCAAAACGATTTTTTTCTTGTTTAAATAAAT
CTTGGATGGTGGTGTTTGATAATTCAGCTTTATGTGCTTCGAGAGATTTCCACGCTTGGGTGTGAGTTGG
GTTAATATTTTTCATGGTATTTCCTTTCATTAAAAATAATTGAAATTTTAACCGCACTTTCTGGAATTTT
TATTAGGGAGAATGACTCCCTCTGTTCAAAAAATGCAGTGATTAATCAACGTATTCAGTTATAACACGAG
GTGTTAATTTTGTAATTAGCTCGTAGCTTAAAATGCCTGTGAATTTAGCTACGGTTTCAATAGGTAATTC
CTTGCCCCATAAAATTACTTCATCGCCTACCAAATCTTGGCTATCTGCGCCTAAATCAACAGTGAGCATA
TCCATTGACACACGTCCAACAATTGGTACAAGACGGCCATTTAAATAAACAGGTGTACCTTCTGGCACAT
CGCGCGGATAACCATCGCCATAACCCATTGCGACCACGCCAATTTTAGTATCTCGTGGACTTGTCCAAAT
ACCGCCGTAACCTACAGGATCGCCTTGTTTATGATGGCGAACGGCAATTAATGACGAGGTTAAATTCATC
ACTGGCGTTAAGCCAAACTCTTTACCGATAGTATTAGTTGGAGAAATGCCGTACATAATAATGCCTGGGC

GGATACATTCTAAGTGAGATTTTGGCCAGAAAAGAATGCCGCCAGAAGCTGCGATAGTGCGTTCACCTTG
TTTATCTTTTGTGGCGGATAAAAAACGATTGATTTGAAGTTGGGTGTAATCTGATTCTAGTTCATCGGCT
CGGCTGAAATGGCTGACAAAGCCTAAGTGCGGTTGAATTTGAGGGAGTTTTTTCAGTTCTTGATAAAAAT
AATCCACTTCATCAAGAGCAACACCCAAGCGATGCATTCCCGTATCTATTTTTAACCAAACTTTAATTGG
ACTTGGTAAATTTGAACGTTTTAAAGCCTCAAGCTGTTCGTGATTATGCACCACGGTTTCAATATTATTA
ACGGCTAGAATAGGCAAATCTTGTTCATTAAAAAAGCCTTCAAGTAATAAAATCGGTTTAGTGATGCCGT
TGGAGCGTAATGCTAAAGCCTCTTCTAAACGAGCCACGCCAAAGCAATCGACATTTTGTTCTAAAGTTGA
TGCAACAAACACAACGCCGTGACCATAAGCATTTGCTTTAACCACAGCAATAATTTTGCTATTTGGTGCT
TTTTGTTTAATTATTTCTAAATTTTGTTTTAAGGCGTGCGAGCTAATTTTCGCTGTCGCCGGTTTTACGT
TCATTATTTTTCCTTAATAATCATCTCGATATTCACGTTGTTCAGCGAGATTGTCGAAGCGTGAGAATTG
TCCATTAAATTTTAACCGCACTCGACCAATTGGGCCGTTACGCTGTTTACCGATAATAATTTCTGCAACG
CCTTTATCTTCCGAGTTATCGTTATAGACTTCGTCTCGGTAAATAAACATAATCAAGTCTGCATCTTGTT
CAATAGAGCCTGATTCACGTAAATCTGAGTTTACAGGGCGTTTGTCTGCACGTTGTTCTAAAGTACGATT
TAACTGAGAAAGGGCGACTACTGGCACTTGTAATTCTTTGGCGAGTGCTTTGAGGGAACGAGAAATTTCT
GCGATTTCTAGTGTTCGGTTATCTGAAAATGCGGGTGCGCGCATTAATTGCAAATAATCCACCATAATCA
TACTTAATCCACCATTTTCACGATAAACTCGGCGTGCGCGCGAACGAACATCGGTAGGTGTTAGACCTGA
AGAATCATCAATAAAAAAGATTATTTTTTTGCTTGAACATTCCCACTACGCTAGCAATTTTATTCCACTC
GATTTCATCTAAATTTTGACCTGTTCGGATTTTAGTTTGATCAACGCGAGCAAGGGAAGCTATCATACGC
ATCATAATTTGTTCTGCTGGCATTTCTAAACTAAATACTAAAACGGGTTTTTCACTTGCCATTGCGGCAT
TTTCGCAAAGGTTCATGGCGAAAGTAGTTTTACCCATTGACGGACGTGCCGCAACGATAATTAAGTCAGA
AGGTTGTAAACCTGCCGTTTTTTATCAAGATCAGTGAAACCTGTCGTAATGCCCGTTACACCTGAATGAT
TTTCAAGTTTGCTTAAAATATCGATTTTTTCAATCGTACTTTCCAGCACATTGATCACATTTTGTGGGCC
TTCACTAGAAGTTGTCCGTTTTTCTGCAATCGCAAATACTTCACGCTCAGCTTCATCAAGAATTAACTTA
ATGTCTTGCCCTTTAGGAGAATAGCTATTTTCAGCAATGCGATTCCCTACCGAAATAAGTTCTCGTAATA
TGGCTTTCTCGCGCACGATATCTGCATAAGCCAAAATATTAATGGCGTTCGGAGTATTATTAGAAAGCTC
TGCTAGATAGGCAAATCCACCTACTTCATCGCTTACACCACGGCTTCTTAAGGATTGATCTAGCGTAATT
AAATCAATAGGCGATTGATTACGCATTAGATGTTCCATTTCTGTAAAAATTAGACGATGCTGAAAAGTAT
AAAAATCGTCAGCAATCACACGTTCAGCAATGCCATCCCAATGTTGATTGCTCAGCATGATGCCACCCAA
CACGGCTTGTTCAGCCTCAAGTGAGTGTGGTGGAATACTTATTTGTGCCGTTTTTTTGTCTGAAGATTTG
ATTTGAGGTTGTGATGCCATAGGACTTATTTCGATACTAGAATGTCGCCTATGATACCGCAAATATCTAT
TGGATTTAAGTGAAAAGTGCGGTGAAAAAAGGAAATAAAAAACGGTGGAAAAATCCACCGCTCTTTCATT
TTAACGTATTTAGATTGTTGATTATTCAACAATTAATGTACGACATACGTTAGTTTGTGTCGCACCTTGA
CCACCTTGGGTTACCAGCACTAAATCGCCAGTAGATAAATAACCTTTTTCTTTTAATGATTGAAGTGCTG
CTTTTGCACCTGCTTCTGTACGACTTTCTTCGCCGTGATAAATTGGTGTTACACCGCGGTATAGTGCACA
AAGGTTTAGGGTTTCTTGATTACGAGATAAAGCAAAGATTGGTAAGCCAGAGCTAATGCGTGACATTAAT
AATGGAGTACGGCCTGTGCTAGTTAAAGTGACGATTGCCGCTACACCTTTCATGTGGTTTGCTGCATACA
TTGCAGACATCGCAACAGACTCTTCAATGGTTTCAAATTCTTTATCCATACGGTGACGAGAAACGTTAAT
GCTTGGCATTTTTTCTGCACCTAAACATACGCTAGCCATTGCTGCCACTGTTTCTGAAGGATATTGACCT
GCTGCTGTTTCTGCAGAAAGCATAACTGCATCAGTTCCATCTAATACTGCGTTTGCAACGTCCATTACTT
CAGCACGCGTTGGCATTGGATTGCTAATCATTGATTCCATCATTTGAGTCGCTGTAATTACAGCACGATT
TAATTGACGTGAACGACGAATTAATTTTTTCTGTACACCGACTAATTCAGGATCGCCGATTTCTACGCCT
AAGTCACCACGAGCAACCATAATTACATCGGATGCTAAAATAATATCATCCATGGCTTCATCATTAGCAA

CGGTTTCTGCACGTTCAACTTTAGCAACGATTTTTGCATTTAAACCTGCTTGTTGAGCAAGTTCACGTGC
ATAATTTAAATCTGCACTTGAACGAGGGAAAGAAACGGCTAAGAAATCAACACCAATACGTGCAGCGGTA
ATAATGTCGGCTTTATCTTTTTCTGTTAGGGCATCCGCAGATAAACCGCCACCTAATTTATTAATACCTT
TATTATTTGATAATGGACCACCAACAGTAACTTCAGTGAAAACTTTTGCACCATCAGTTGATAATACTTT
TAATTGAACACGGCCATCATCTAATAAAAGAATATCGCCCGGCACAACATCTTGAGGAAGCGTTTTATAG
TCTAAACCAACGGATTCTTGAGTGCCTTCGCCTTTTGGTAACTCTGCATCAAGAATGAATTTATCGCCA
4. Pada menu “Choose closest organism”, pilih BACTERIAL generic.
5. Klik PROCESS.
Q1 : Ada berapa gen yang dihasilkan?
Q2 : Ada berapa Transcription Unit pada sekuen tersebut?
Q3 : Ada berapa Operon?
Q4 : Berapa produk gen (aa) terpanjang yang dihasilkan? Pada urutan
nukleotida ke-berapa?
PROMOTER PREDICTION IN PROKARYOTES
1. Buka halaman www.softberry.com.
2. Pada Link Operon and Gene Finding in Bacteria, klik BPROM.
3. copy dan paste sekuen diatas pada kotak isian
4. Klik PROCESS.
Q5 : Ada berapa promoter yang Anda temukan?
Q6 : Sebutkan urutan nukleotida apa saja yang dijadikan tempat
TF binding site (tempat berikatannya Faktor2 transkripsi).(tiga sekuen saja...)

Modul B
GENE PREDICTION IN EUKARYOTES
AB-INITIO-BASED GENE PREDICTION PROGRAM
1. Pada halaman www.softberry.com, klik link GENE FINDING in Eukaryota. lalu pilih FGENESH
2. Masukkan sekuen
>gi|28380636|ref|NG_000007.3| Homo sapiens beta globin region (HBB@); and hemoglobin, beta
(HBB); and hemoglobin, beta pseudogene 1 (HBBP1); and hemoglobin, delta (HBD); and hemoglobin,
epsilon 1 (HBE1); and hemoglobin, gamma A (HBG1); and hemoglobin, gamma G (HBG2), on
chromosome 11
ATTCCCCCAATCATTACTTCTGTCACATTGATAGTTAAATAATTTCTGTGAATTTATTCCTTGATTCTAA
AATATGAGGATAATGACAATGGTATTATAAGGGCAGATTAAGTGATATAGCATGAGCAATATTCTTCAGG
CACATGGATCGAATTGAATACACTGTAAATCCCAACTTCCAGTTTCAGCTCTACCAAGTAAAGAGCTAGC
AAGTCATCAAAATGGGGACATACAGAAAAAAAAAAGGACACTAGAGGAATAATATACCCTGACTCCTAGC
CTGATTAATATATCGATTCACTTTTTTCTCTGTTTGATGACAAATTCTGGCTTTAAATAATTTTAGGATT
TTAGGCTTCTCAGCTCCCTTCCCAGTGAGAAGTATAAGCAGGACAGACAGGCAAGCAAGAAGAGAGCCCC
AGGCAATACTCACAAAGTAGCCAATGTCCCCTGTGGTCATAGAGAAATGAAAAGAGAGAGGATTCTCTGG
AAGCACTGGATGTAATCTTTTCTGTCTGTCCTCTCTAGGGAATCACCCCAAGGTACTGTACTTTGGGATT
AAGGCTTTAGTCCCACTGTGGACTACTTGCTATTCTGTTCAGTTTCTAGAAGGAACTATGTACGGTTTTT
GTCTCCCTAGAGAAACTAAGGTACAGAAGTTTTGTTTACAATGCACTCCTTAAGAGAGCTAGAACTGGGT
GAGATTCTGTTTTAACAGCTTTATTTTCTTTTCCTTGGCCCTGTTTTTGTCACTGTCACCACCTTTAAGG
CAAATGTTAAATGCGCTTTGGCTGAAACTTTTTTTCCTATTTTGAGATTTGCTCCTTTATATGAGGCTTT
CTTGGAAAAGGAGAATGGGAGAGATGGATATCATTTTGGAAGATGATGAAGAGGGTAAAAAAGGGGACAA
ATGGAAATTTGTGTTGCAGATAGATGAGGAGCCAACAAAAAAGAGCCTCAGGATCCAGCACACATTATCA
CAAACTTAGTGTCCATCCATCACTGCTGACCCTCTCCGGACCTGACTCCACCCCTGAGGGACACAGGTCA
GCCTTGACCAATGACTTTTAAGTACCATGGAGAACAGGGGGCCAGAACTTCGGCAGTAAAGAATAAAAGG
CCAGACAGAGAGGCAGCAGCACATATCTGCTTCCGACACAGCTGCAATCACTAGCAAGCTCTCAGGCCTG
GCATCATGGTGCATTTTACTGCTGAGGAGAAGGCTGCCGTCACTAGCCTGTGGAGCAAGATGAATGTGGA
AGAGGCTGGAGGTGAAGCCTTGGGCAGGTAAGCATTGGTTCTCAATGCATGGGAATGAAGGGTGAATATT
ACCCTAGCAAGTTGATTGGGAAAGTCCTCAAGATTTTTTGCATCTCTAATTTTGTATCTGATATGGTGTC
ATTTCATAGACTCCTCGTTGTTTACCCCTGGACCCAGAGATTTTTTGACAGCTTTGGAAACCTGTCGTCT
CCCTCTGCCATCCTGGGCAACCCCAAGGTCAAGGCCCATGGCAAGAAGGTGCTGACTTCCTTTGGAGATG
CTATTAAAAACATGGACAACCTCAAGCCCGCCTTTGCTAAGCTGAGTGAGCTGCACTGTGACAAGCTGCA
TGTGGATCCTGAGAACTTCAAGGTGAGTTCAGGTGCTGGTGATGTGATTTTTTGGCTTTATATTTTGACA
TTAATTGAAGCTCATAATCTTATTGGAAAGACCAACAAAGATCTCAGAAATCATGGGTCGAGCTTGATGT
TAGAACAGCAGACTTCTAGTGAGCATAACCAAAACTTACATGATTCAGAACTAGTGACAGTAAAGGACTA
CTAACAGCCTGAATTGGCTTAACTTTTCAGGAAATCTTGCCAGAACTTGATGTGTTTATCCCAGAGAATT
GTATTATAGAATTGTAGACTTGTGAAAGAAGAATGAAATTTGGCTTTTGGTAGATGAAAGTCCATTTCAA
GGAAATAGAAATGCCTTATTTTATGTGGGTCATGATAATTGAGGTTTAGAAAGAGATTTTTGCAAAAAAA
ATAAAAGATTTGCTCAAAGAAAAATAAGACACATTTTCTAAAATATGTTAAATTTCCCATCAGTATTGTG
ACCAAGTGAAGGCTTGTTTCCGAATTTGTTGGGGATTTTAAACTCCCGCTGAGAACTCTTGCAGCACTCA

CATTCTACATTTACAAAAATTAGACAATTGCTTAAAGAAAAACAGGGAGAGAGGGAACCCAATAATACTG
GTAAAATGGGGAAGGGGGTGAGGGTGTAGGTAGGTAGAATGTTGAATGTAGGGCTCATAGAATAAAATTG
AACCTAAGCTCATCTGAATTTTTTGGGTGGGCACAAACCTTGGAACAGTTTGAGGTCAGGGTTGTCTAGG
AATGTAGGTATAAAGCCGTTTTTGTTTGTTTGTTTGTTTTTTCATCAAGTTGTTTTCGGAAACTTCTACT
CAACATGCCTGTGTGTTATTTTGTCTTTTGCCTAACAGCTCCTGGGTAACGTGATGGTGATTATTCTGGC
TACTCACTTTGGCAAGGAGTTCACCCCTGAAGTGCAGGCTGCCTGGCAGAAGCTGGTGTCTGCTGTCGCC
ATTGCCCTGGCCCATAAGTACCACTGAGTTCTCTTCCAGTTTGCAGGTGTTCCTGTGACCCTGACACCCT
CCTTCTGCACATGGGGACTGGGCTTGGCCTTGAGAGAAAGCCTTCTGTTTAATAAAGTACATTTTCTTCA
GTAATCAAAAATTGCAATTTTATCTTCTCCATCTTTTACTCTTGTGTTAAAAGGAAAAAGTGTTCATGGG
CTGAGGGATGGAGAGAAACATAGGAAGAACCAAGAGCTTCCTTAAGAAATGTATGGGGGCTTGTAAAATT
AATGTGGATGTTATGGGAGAATTCCAGGATTCCAAGGAGGATGATATGATGGAGAAAAATCTTTATCGGG
GTGGGAAAATGGTTAATTAAGTGGACAGAGACTCCTAGGCAGTTTTTACTGCACCGGGGAAAGAAGGAGC
TGTTAGTGGTACCTGAGAAAGCAGATTTGTGGTACATGTCACTTTTCATTAAAAACAAAAACAAAACAAA
ACAAAACTTCATAGATATCCAAGATATAGGCTAGAATTACTATTTTAATTTACTCTTATTTACATTTTGA
AGTAGCTAGCTTGTCACATGTTTTATGAAATTGATTTGGAGATAAGATGAGTGTGTATCAACAATAGCCT
GCTCTTTCCATGAAGGATTCCATTATTTCATGGGTTAGCTGAAGCTAAGACACATGATATCATTGTGCAT
TATCTTCTGATAGAATGTAACATGCACTAAAATAAAGTTAGAGTTAGGACCTGAGTGGGAAAGTTTTTGG
AGAGTGTGATGAAGACTTTCCGTGGGAGATAGAATACTAATAAAGGCTTAAATTCTAAAACCAGCAAGCT
AGGGCTTCGTGACTTGCATGAAACTGGCTCTCTGGAAGTAGAAGGGAGAGTAAGACATACGTAGAGGACT
AGGAAAGACCAGATAGTACAGGGCCTGGCTACAAAAATACAAGCTTTTACTATGCTATTGCAATACTAAA
CGATAAGCATTAGGATGTTAAGTGACTCAGGAAATAAGATTTTGGGAAAAAGTAATCTGCTTATGTGCAC
AAAATGGATTCAAGTTTGCAGATAAAATAAAATATGGATGATGATTCAAGGGGACAGATACAATGGTTCA
AACCCAAGAGGAGCAGTGAGTCTGTGGAATTTGAAGGATGGACAAAGGTGGGGTGAGAAAGACATAGTAT
TCGACTGACTGTGGGAGATGAGAAGGAAGAAGGAGGTGATAAATGACTGAAAGCTCCCAGACTGGTGAAG
ATAACAGGAGGAAACCATGCACTGACCTGGTGACTCTCATGTGTGAAGGGTAGAGGGATATTAACAGATT
TACTTTTTAGGAAGTGCTAGATTGGTCAGGGAGTTTTGACCTTCAGGTCTTGTGTCTTTCATATCAAGGA
ACCTTTGCATTTTCCAAGTTAGAGTGCCATATTTTGGCAAATATAACTTTATTAGTAATTTTATAGTGCT
CTCACATTGATCAGACTTTTTCCTGTGAATTACTTTTGAATTTGGCTGTATATATCCAGAATATGGGAGA
GAGACAAATAATTATTGTAGTTGCAGGCTATCAACAATACTGGTCTCTCTGAGCCTTATAACCTTTCAAT
ATGCCCATAAACAGAGTAAACAGGGATTATTCATGGCACTAAATATTTTCACCTAGTCAGTCAACAAATG
GGAGCAATGTGCATTTTTTGATACATATTTTTATATATTTATGGGGTACATGTGATACTTACATGCCTAG
AACATGTGATGATTAAGTCTAGATATTTAGGATATCCATTGCTTTGAGCATTTATCATTTCTATGTATTG
AGAAAATTTCAAATCCTCATTTCTAGCCATTTTGAAATATATAATAAATAGTAATTAACTATAGTCACCC
TACTCAAATATCAAACATTATGGCTTAATCCTTCTATCCAACTGTGTTTGTACCTATTAACCAACATCTC
TTAAATCCCCTCCCATACACACTCACACTTTTTCCAGCCTCTGATAACTATCATTCTACTCTCTACCACC
ATGAGACCCACTTTTTTAGCTCCCACAGATGAATAAAAACATGTGATATTTGACTTTCTGTATCTGGCTT
ATTTTATTATCTATCTCTTTGGCATACCAAGAGTTTGTTTTTGTTCTGCTTCAGGGCTTTCAATTAACAT
AATGACCTCTGGTTCCATCCATGTTGCTACAAATGACAAGATTTCATTCTTTTTCATGGCAAAATAGTAC
3. Sesuaikan pilihan organism dengan sekuen yang didapat.
4. Klik SEARCH
Q1 : Ada berapa gen yang dihasilkan?

Q2 : Berapa exon yang dihasilkan oleh gen tersebut? Intron?
Q3 : Pada nukleotida ke berapa transkripsi dimulai dan berakhir?
Q4 : Berapa panjang produk gen (aa) yang dihasilkan?
5. Klik Show picture of predicted genes in PDF file.
Q5 : Apa kesimpulan Anda?
6. save sekuen protein yang diperoleh, simpan dalam bentuk fasta
7. Buka halaman http://genes.mit.edu/GENSCAN.html
8. Masukkan option Vertebrate pada menu Organism dan Predicted CDS and peptides
pada link Print options.
9.Masukkan sekuen yang sama seperti No. 2.
10.Klik Run GENSCAN.
11.Lihat Hasilnya.
Q6 : Apa perbedaan dengan hasil sebelumnya? Ga prediksi tss
HOMOLOGY-BASED GENE PREDICTION PROGRAM
1. Buka halaman http://blast.ncbi.nlm.nih.gov/
2. Pilih blastx program (genomic query versus protein database)
3. Masukkan sekuen yang sama sebelumnya, kemudian run blast!
4. Pilih protein yang teratas dari hasil blast.
Q7: Protein apa yang dihasilkan??
5. Tampilkan urutan asam amino protein tersebut dalam format fasta.
6. Buka alamat http://www.ebi.ac.uk/Tools/Wise2/ (Program genewise). (web server yang
menggunakan database protein untuk memprediksi gen pada suatu sekuens).
7. Copy paste sekuens protein yang telah didapat pada bagian sekuens 1 kemudian copy sekuens
DNA awal pada bagian sekuens 2. Klik RUN!!
8. Q7: Berapakah jumlah gen yang muncul?? Pada urutan nukletida ke berapa gen tersebut??
9. Q8: apa perbedaan cara dari prediksi gene dengan menggunakan FGENESH dan genewise??

Modul C
1. Ambil sekuen gen dengan keyword AF331849.1 di NCBI, buat dalam FASTA format.
Q1 : Gen apakah ini?
Q2 : Pada organisme apakah gen ini berasal?
2. Pada halaman www.softberry.com, klik link SEARCH FOR MOTIFS, lalu pilih
TSSP.
3. Masukkan sekuen gen tersebut, lalu klik PROCESS.
Q3 : Ada berapa promoter yang didapatkan? Bagaimana Anda mengetahuinya?
Q4 : Pada posisi berapa promoter tersebut berada?
Q5 : Pada posisi berapa TATA box berada?
4. Buka halaman http://mendel.cs.rhul.ac.uk/mendel.php
5. Pada menu fitur, klik [Gene prediction, Plant promoter finding] di sebelah kiri
6. Masukkan sekuen pada No.1
7. Pada pilihan organism, pilih Monocots.
8. Pilih TSSP-TCM pada opsi “Gene structure prediction (multiple genes, both chains)”.
9. Klik PERFORM SEARCH.
Q6 : Ada berapa promoter yang ditemukan? Pada posisi berapa?
Q7 : Pada posisi berapa TATA box berada?
Q8 : Dari kedua program di atas, apa kesimpulan Anda?
-----Selamat Mengerjakan  (NY)----

�ݺ�ߣ

Modul 6 gene prediction 191011

Convert to study materialsBETA

More Related Content

Modul 6 gene prediction 191011