This document discusses gene prediction in prokaryotes. It provides instructions on using the FGENESB program on the Softberry website to analyze bacterial DNA sequences and predict genes. The document then provides a long example bacterial DNA sequence from Haemophilus influenzae for users to copy and paste into the program to predict genes within the sequence.
1 of 8
More Related Content
Modul 6 gene prediction 191011
1. MODUL 6 GENE PREDICTION
Modul A
GENE PREDICTION IN PROKARYOTES
1. Buka halaman www.softberry.com
2. Klik link OPERON AND GENE FINDING IN BACTERIA yang ada di bagian kiri, lalu pilih FGENESB.
3. Copy dan paste sekuen ke kotak isian
>gi|148717999|gb|CP000672.1| Haemophilus influenzae PittGG, parsial
GTTAAATTTGCCAATCAATTTGTGGATATTATTGAACTTCCACTTCCTAAAAATAAAAAATATCCAATTG
AGGGATGGGAACATATTGAGATTGTAATGCCATTTTTACCGAAAGAATCGATAAATGAATGGATTAACCG
TGTTAATATGTATTTTTTATGGGACAAATTAACTCAATTAACCATTAAAGTGAGCGAGCCTAAAGTGGAT
GGGGAAAGATTACCAAATCCATCTATTGCAGTAAGTTTTACGGATAAAACAGTAAATCATACTTGCATTA
AGGTTCATCCTTATTCTATAAAAAAATACTTGAGGTTTAGTAAAAATGAATAAATTATCACTTGCATTCG
TTGTTTAGCAACAGTAGACTTGAGTGCTTGTTCTGCCCTTCAAAAGGGGGAGGGGACTTATAAAGGTCAA
ATTATTTTTAGTCAAATGGAAGGCAAAAATCTAAAATTAACTGTTCGTAAAAATGATTGTTCTGGTAACC
AGCAGAAAGGAGAGGAAGTTGTTATTGTGCATAAGTATGATTCAACTTTAGTTGTTGGTGCTTGTGTTTT
AGTATCTGACAATGGTAATACTAAAGACATTTCAACTTTTTCTCCAAGAAACCCACTTTAATTCCTTCTA
ATATAGAGAATATTATATGAAAAAAACAAATATGGCATTAGCACTGTTAGTTGCTTTTAGTGTAACTGGT
TGTGCAAATACTGATATTTTCAGCGGTGATGTTTATAGCGCATCTCAAGCAAAGGAAGCGCGTTCAATTA
CTTATGGTACGATTGTTTCTGTACGCCCTGTTAAAATCCAAGCTGATAATCAAGGTGTAGTTGGTACGCT
TGGTGGTGGAGCTTTAGGTGGTATTGCTGGTAGTACAATTGGCGGTGGTCGTGGTCAAGCTATTGCAGCA
GTAGTTGGTGCAATTGGCGGTGCAATAGCTGGAAGTAAAATCGAAGAAAAAATGAGTCAAGTAAACGGTG
CTGAACTTGTAATTAAGAAAGATGATGGTCAAGAGATCGTTGTTGTTCAAAAGGCTGACAGCAGTTTTGT
AGCTGGTCGCCGAGTTCGTATTGTTGGTGGCGGCTCAAGCTTAAATGTTTCTGTGCTATAACCAATAGCA
TTAAAGTCTAATATGATTAATCAGTGTCTTAACTTAGTAAGGCACTGATTTTTTATAATTAAATTCATTT
AAAATATATATTTATCGTCTATCTAAGATAAATTTAAAGGACTAAATTAGAATTTAGTCCTTTTAGACAA
ACTTGGAATTTGTTCCCCTTTCTGAACACTCTATCTAAAATATAACATTTATTTTTCTTATGAACTTTTT
TATAATCTTTAAATTTTGCTTTAAATCAAATAATTCAAGATGATATTTAATAAAATGTAAGAGTGAAGTT
ATAGTATATTTATCTAAGCTCATATACATCTCATAAAGTATACTTTTCAACACTTTATTACTTTTATCCA
CATGATATATTTCTAGCAACGACACACTATTAATTACTTTTATATCTATACCTATCTTATTAAGGTAATA
TGTAATATTTTCCTCTTTATCTTTTTAGCTACCTCATTTGCTTATGATTATAAACTGATGATGTTTGGTT
TCCATGTAGTCTATATTTTACCAATGCTTCAGGATAATTAGCTAAACAACCAAGCCTACTAACCTCTGAC
CAAAACTTATAATCTTCTGCATACGGATAATCTTTATTAAAGATTAATTTATGCTCTCTATATACATTTG
CTCTCATAATCATAGTGTTGTTATGTATCGGATTATAGAAAAGCATAGCTTCACAAATATCATTATGTAG
CAATGGATTTTTCCATATATCACCAGTTTTATATTTAGAACCGATAATGCCACATTCTTTTTCTACAATA
ATCTCTAAGTATGATCCCATTGCTGTAATATGATCATTTTTCTCCAGATAGGTAACTATTTTCTCAATCC
ACGATGGTTTAGCTATATCATCAGCATCCATTCTTGCAAAATATTTACCTGAAAAACAACCAAGGCCTAT
ATTCAAAGAATTTATGAACCCTAAATTATATTTATTACTGATAATTTTTATCCTTTTATCTAATTTAGAT
ATTTCTTCTAAATGAGACAAAGTCAAATCTGTTGAACCATCATTGATAACTATAATTTCTAGATTTTTAT
7. Q2 : Berapa exon yang dihasilkan oleh gen tersebut? Intron?
Q3 : Pada nukleotida ke berapa transkripsi dimulai dan berakhir?
Q4 : Berapa panjang produk gen (aa) yang dihasilkan?
5. Klik Show picture of predicted genes in PDF file.
Q5 : Apa kesimpulan Anda?
6. save sekuen protein yang diperoleh, simpan dalam bentuk fasta
7. Buka halaman http://genes.mit.edu/GENSCAN.html
8. Masukkan option Vertebrate pada menu Organism dan Predicted CDS and peptides
pada link Print options.
9.Masukkan sekuen yang sama seperti No. 2.
10.Klik Run GENSCAN.
11.Lihat Hasilnya.
Q6 : Apa perbedaan dengan hasil sebelumnya? Ga prediksi tss
HOMOLOGY-BASED GENE PREDICTION PROGRAM
1. Buka halaman http://blast.ncbi.nlm.nih.gov/
2. Pilih blastx program (genomic query versus protein database)
3. Masukkan sekuen yang sama sebelumnya, kemudian run blast!
4. Pilih protein yang teratas dari hasil blast.
Q7: Protein apa yang dihasilkan??
5. Tampilkan urutan asam amino protein tersebut dalam format fasta.
6. Buka alamat http://www.ebi.ac.uk/Tools/Wise2/ (Program genewise). (web server yang
menggunakan database protein untuk memprediksi gen pada suatu sekuens).
7. Copy paste sekuens protein yang telah didapat pada bagian sekuens 1 kemudian copy sekuens
DNA awal pada bagian sekuens 2. Klik RUN!!
8. Q7: Berapakah jumlah gen yang muncul?? Pada urutan nukletida ke berapa gen tersebut??
9. Q8: apa perbedaan cara dari prediksi gene dengan menggunakan FGENESH dan genewise??
8. Modul C
1. Ambil sekuen gen dengan keyword AF331849.1 di NCBI, buat dalam FASTA format.
Q1 : Gen apakah ini?
Q2 : Pada organisme apakah gen ini berasal?
2. Pada halaman www.softberry.com, klik link SEARCH FOR MOTIFS, lalu pilih
TSSP.
3. Masukkan sekuen gen tersebut, lalu klik PROCESS.
Q3 : Ada berapa promoter yang didapatkan? Bagaimana Anda mengetahuinya?
Q4 : Pada posisi berapa promoter tersebut berada?
Q5 : Pada posisi berapa TATA box berada?
4. Buka halaman http://mendel.cs.rhul.ac.uk/mendel.php
5. Pada menu fitur, klik [Gene prediction, Plant promoter finding] di sebelah kiri
6. Masukkan sekuen pada No.1
7. Pada pilihan organism, pilih Monocots.
8. Pilih TSSP-TCM pada opsi Gene structure prediction (multiple genes, both chains).
9. Klik PERFORM SEARCH.
Q6 : Ada berapa promoter yang ditemukan? Pada posisi berapa?
Q7 : Pada posisi berapa TATA box berada?
Q8 : Dari kedua program di atas, apa kesimpulan Anda?
-----Selamat Mengerjakan (NY)----