Rabu, 13 Juni 2012

ANALISIS URUTAN BASA DNA


Istilah bioinformatics mulai dikemukakan pada pertengahan era 1980-an. Bioinformatika  mengacu pada penerapan komputer dalam biologi. Namun demikian, penerapan bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan pengembangan algoritma untuk analisis sekuens biologis) sudah dilakukan sejak tahun 1960-an (Attwood, T.K., Kajian baru Bioinformatika ini tak lepas dari perkembangan biologi molekul modern yang ditandai dengan kemampuan manusia untuk memahami genom, yaitu cetak biru informasi genetik yang menentukan sifat setiap makhluk hidup yang disandi dalam bentuk pita molekul DNA. Kemampuan untuk memahami dan memanipulasi kode genetik DNA ini sangat didukung oleh TI melalui perangkat perangkat keras maupun lunak. Bioteknologi modern ditandai dengan kemampuan pada manipulasi DNA. Rantai/sekuen DNA yang mengkode protein disebut gen. Gen ditranskripsikan menjadi mRNA, kemudian mRNA ditranslasikan menjadi protein yang disebut sentral dogma dalam biologi molekuler. Protein bertugas menunjang seluruh proses kehidupan, antara lain sebagai katalis reaksi biokimia dalam tubuh, berperan serta dalam sistem pertahanan tubuh melawan virus, parasit dan lain-lain.
Kelahiran bioinformatika modern tak lepas dari perkembangan bioteknologi di era tahun 70-an, dimana seorang ilmuwan AS melakukan inovasi dalam mengembangkan teknologi DNA rekombinan. Berkat penemuan ini lahirlah perusahaan bioteknologi pertama di dunia, yaitu Genentech di AS, yang kemudian memproduksi protein hormone insulin dalam bakteri, yang dibutuhkan penderita diabetes. Selama ini insulin hanya bisa didapatkan dalam jumlah sangat terbatas dari organ pankreas sapi.
Bioinformatika, sesuai dengan asal katanya yaitu "bio" dan "informatika", adalah gabungan antara ilmu biologi dan ilmu teknik informasi (TI). Pada umumnya, Bioinformatika didefenisikan sebagai aplikasi dari alat komputasi dan analisa untuk menangkap dan menginterpretasikan datadata biologi. Ilmu ini merupakan ilmu baru yang yang merangkup berbagai disiplin ilmu termasuk ilmu komputer, matematika dan fisika, biologi, dan ilmu kedokteran, dimana kesemuanya saling menunjang dan saling bermanfaat satu sama lainnya. Ilmu bioinformatika lahir atas insiatif para ahli ilmu komputer berdasarkan artificial intelligence. Mereka berpikir bahwa semua gejala yang ada dialam ini bisa dibuat secara artificial melalui simulasi dari gejalagejala tersebut. Untuk mewujudkan hal ini diperlukan datadata yang yang menjadi kunci penentu tindaktanduk gejala alam tersebut, yaitu gen yang meliputi DNA atau RNA. Bioinformatika ini penting untuk manajemen datadata dari dunia biologi dan kedokteran modern. Perangkat utama bioinformatika adalah program software dan didukung oleh kesediaan internet.
Kebutuhan untuk mengumpulkan, menyimpan dan menganalisa data-data biologis dari database DNA, RNA maupun protein inilah yang semakin memacu perkembangan kajian bioinformatika, bahkan dari urutan DNA maupun asam amino yang ada, dapat diprediksikan peran proteinnya, tingkat aktivitas dan mekanisme kerjanya menggunakan berbagai jenis perangkat lunak yang tersedi. Selain itu, dengan bioinformatik perancangan primer untuk mendeteksi keberadaan suatu gen dari spesies tertentu dapat dilakukan. 
Bioinformatika adalah organisasi dan analisis komplek data yang dihasilkan dari analisa molekuler dan teknik biokimia, disamping itu bioinformatika merupakan teknologi untuk koleksi, peyimpanan analisis, interprestasi, pelepasan dan aplikasi untuk informasi biologi. Analisis dilakukan dengan cara membandingkan data yang masuk dengan ribuan data lain yang tersedia di dalam pangkalan data. Suatu urutan DNA ataupun asam amino dari hasil sekuensing dapat diketahui kemiripannya dengan urutan yang tersimpan dalam data base melalui teknik bioinformatik. Bahkan dari urutan DNA maupun asam amino yang ada, dapat diprediksikan peran proteinnya, tingkat aktivitas dan mekanisme kerjanya menggunakan berbagai jenis perangkat lunak yang tersedia. Selain itu, dengan bioinformatik perancang primer untuk mendeteksi keberadaan suatu gen dari spesies tertentu dapat dilakukan (Nuswantara, 2000).
Bioinformatika juga menerjemahkan penemuan ke klinik dengan menyebarkan penemuan melalui curated, database dicari seperti Pharm GKB, dbGaP, PacDB dan FDAAERS.  Sebuah hambatan utama bagi database ini adalah kurasi manual data. Secara biologis dan secara medis fokus pada teks penambahan algoritma yang dapat mempercepat koleksi data terstruktur, seperti metode yang menggunakan sintaks kalimat dan pengolahan bahasa alami untuk mendapatkan obat-gen dan gen-gen interaksi dari literatur ilmiah. Database dan metode ini perlu dikembangkan dan digunakan dengan hati-hati. Semua sumber-sumber data yang rentan terhadap kesalahan dan sehingga validasi data sangat penting, terutama sebelum informasi tersebut diterapkan di klinik (Fernald et al, 2011).
Beberapa contoh kegunaan Bioinformatika :
1. Bioinformatika dalam Bidang Klinis
Aplikasi Informatika ini berbentuk data-data mengenai informasi klinis dari seorang pasien seperti data analisa diagnosa laboratorium, hasil konsultasi dan saran, foto rontgen, ukuran detak jantung, dan lain lain.
2. Bioinformatika untuk Identifikasi Agent Penyakit Baru
            Aplikasi ini digunakan untuk mendeteksi kemungkinan penyakit baru yang akan muncul baik melalui virus ataupun media yang lainnya.
3. Bioinformatika untuk Diagnosa Penyakit Baru
            Aplikasi ini digunakan untuk mendiagnosa penyakit apa yang diderita oleh pasien dan untuk mengetahui obat apa yang tepat dan perawatan yang akan diberikan kepada pasien.
4. Bioinformatika untuk Penemuan Obat
Aplikasi ini digunakan untuk menemukan terobosan pada obat dengan kombinasi berbagai macam senyawa seperti enzim, asam amino dan lain-lain.
Praktikum kali ini yaitu menggunakan program online BLAST dan NEBcutter untuk analisis urutan basa DNA. BLAST (Basic Local Alignment Search Tool) merupakan suatu alat pencari yang dapat menyesuaikan dan mencari sekuen yang mirip dengan sekuen meragukan yang kita miliki melalui perbandingan sekuen melalui GenBank DNA database dalam waktu singkat. Ada 5 program utama dalam BLAST, yaitu:
1.      Nucleotide blast (blastn): membandingkan suatu sekuen nukleotida yang kita miliki dengan database sekuen nukleotida.
2.      Protein blast (blastp): membandingkan suatu sekuen asam amino yang kita miliki dengan database sekuen protein.
3.      Blastx: membandingkan produk translasi konsep 6-frame sebuah sekuen nukleotida (translated nucleotide) yang kita miliki dengan database sekuen protein.
4.      Tblastn: membandingkan suatu sekuen protein yang kita miliki dengan database sekuen nukleotida yang secara dinamis ditranslasi pada semua pembacaan 6 frame.
5.      Tblastx: membandingkan suatu translasi 6 frame dari nukleotida.
NEBcutter adalah sebuah alat untuk menentukan enzim restriksi yang memotong urutan DNA tertentu; urutan dapat diberikan oleh pengguna sebagai file teks, file FASTA, atau nomor GenBank. GenBank basis data sekuens adalah akses terbuka, beranotasi koleksi semua yang tersedia secara umum nukleotida urutan dan mereka protein terjemahan. Database ini diproduksi dan dipelihara oleh National Center for Biotechnology Information (NCBI) sebagai bagian dari International Nukleotida Sequence Database Kolaborasi (INSDC). The National Center for Biotechnologi Information merupakan bagian dari National Institute of Health di Amerika Serikat. GenBank dan kolaborator yang menerima urutan diproduksi di laboratorium di seluruh dunia dari lebih dari 100.000 organisme yang berbeda. GenBank terus tumbuh pada tingkat eksponensial, dua kali lipat setiap 18 bulan. Release 155, diproduksi pada bulan Agustus 2006, berisi lebih dari 65 miliar basa nukleotida di lebih dari 61 juta urutan. GenBank dibangun oleh pengajuan langsung dari laboratorium individu, maupun dari kiriman curah dari pusat sequencing skala besar.
Penyejajaran sekuens (sequence alignment) adalah proses penyusunan/pengaturan dua atau lebih sekuens sehingga persamaan sekuens-sekuens tersebut tampak nyata. Hasil dari proses tersebut juga disebut sebagai sequence alignment atau alignment saja. Baris sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda "–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama di antara sekuens-sekuens tersebut. Berikut adalah contoh alignment DNA dari dua sekuens pendek DNA yang berbeda, "ccatcaac" dan "caatgggcaac" (tanda "|" menunjukkan kecocokan atau match di antara kedua sekuens).
ccat---caac
| ||   ||||
caatgggcaac
Sequence alignment merupakan metode dasar dalam analisis sekuens. Metode ini digunakan untuk mempelajari evolusi sekuens-sekuens dari leluhur yang sama (common ancestor). Ketidakcocokan (mismatch) dalam alignment diasosiasikan dengan proses mutasi, sedangkan kesenjangan (gap, tanda "–") diasosiasikan dengan proses insersi atau delesi. Sequence alignment memberikan hipotesis atas proses evolusi yang terjadi dalam sekuens-sekuens tersebut. Misalnya, kedua sekuens dalam contoh alignment di atas bisa jadi berevolusi dari sekuens yang sama "ccatgggcaac". Dalam kaitannya dengan hal ini, alignment juga dapat menunjukkan posisi-posisi yang dipertahankan (conserved) selama evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa posisi-posisi tersebut bisa jadi penting bagi struktur atau fungsi protein tersebut (Rega, 2011).
Selain itu, sequence alignment juga digunakan untuk mencari sekuens yang mirip atau sama dalam basis data sekuens. BLAST adalah salah satu metode alignment yang sering digunakan dalam penelusuran basis data sekuens. BLAST menggunakan algoritma heuristik dalam penyusunan alignment. Beberapa metode alignment lain yang merupakan pendahulu BLAST adalah metode "Needleman-Wunsch" dan "Smith-Waterman". Metode Needleman-Wunsch digunakan untuk menyusun alignment global di antara dua atau lebih sekuens, yaitu alignment atas keseluruhan panjang sekuens tersebut. Metode Smith-Waterman menghasilkan alignment lokal, yaitu alignment atas bagian-bagian dalam sekuens. Kedua metode tersebut menerapkan pemrograman dinamik (dynamic programming) dan hanya efektif untuk alignment dua sekuens (pairwise alignment).
Fungsi-fungsi software yang digunakan sebagai berikut :
1.      BLAST (Basic Local Alignment Search Tool) berfungsi mencari program database urutan biologis. Program ini menggunakan algoritma BLAST untuk membandingkan antara DNA sekuens protein untuk query database.
2.      NEBcutter merupakan program untuk memetakan situs restriksi. Sekuen DNA dapat dimasukkan dengan beberapa cara: (1) Upload dari file yang sudah ada, (2) Memasukkan Accession Number jika input berasal dari data GenBank, (3) Memasukkan sekuen DNA ke kotak yang disediakan, atau (4) Memilih sekuen standar yang ada di database NEBCutter. Kemudian dapat diatur beberapa parameter jika ada yang perlu diubah, dan hasilnya akan tampil.
Program online lain yang dapat digunakan dalam analisis urutan basa DNA adalah PRIMER3. PRIMER3 merupakan program untuk perancangan primer. Primer berfungsi sebagai penginisiasi reaksi polimerisasi DNA secara in vitro, karena tanpa primer, reaksi polimerisasi DNA tidak akan terjadi meskipun enzim dan komponen lainnya sudah tersedia. Selain itu primer juga berfungsi untuk membatasi daerah mana yang akan diamplifikasi pada reaksi PCR. Tahap-tahap dalam merancang primer denagn mentukan tujuan, menyiapkan sekuens referensi, dan bisa di desain dengan batuan software. Perancangan primer menggunakan software PRIMER 3 dengan memeprhatikan parameter untuk masing-masing primer sebagai berikut.
1. Panjang Primer
Secara umum disepakati bahwa panjang primer PCR yang optimal adalah 18-22 bp. Panjang ini cukup panjang untuk mencapai spesifisitas yang cukup, dan cukup pendek bagi primer untuk terikat dengan mudah pada DNA template pada suhu annealing-nya.
2. Suhu Leleh Primer
Suhu leleh atau melting temperature (Tm) adalah temperatur dimana setengah dari duplex DNA akan terpisah menjadi utas tunggal dan Tm juga mengindikasikan stabilitas duplex. Hasil terbaik biasanya diperoleh jika primer memiliki Tm 52-58 °C. Primer dengan nilai Tm di atas 65 °C memiliki kecenderungan untuk terjadinya annealing sekunder. Nilai Tm bisa diindikasikan dari GC content dan dapat dihitung secara akurat menggunakan rumus-rumus tertentu.
3. Suhu Annealing Primer (Ta)                 
Nilai Temperatur Leleh (Tm) merupakan estimasi stabilitas hibrid DNA-DNA dan penting untuk menentukan suhu annealing. Jika Ta terlalu tinggi maka akan menyebabkan hibridisasi primer-template yang kurang baik sehingga yield produk PCR pun akan rendah. Sebaliknya jika Ta terlalu rendah maka bisa menyebabkan banyaknya produk-produk non-spesifik karena akan terjadi banyak mismatch yang menurunkan spesifisitas PCR.
Clustal juga merupakan program bioinformatika untuk alignment multipel (multiple alignment), yaitu alignment beberapa sekuens sekaligus. Dua varian utama Clustal adalah ClustalW dan ClustalX. Metode lain yang dapat diterapkan untuk alignment sekuens adalah metode yang berhubungan dengan Hidden Markov Model ("Model Markov Tersembunyi", HMM). HMM merupakan model statistika yang mulanya digunakan dalam ilmu komputer untuk mengenali pembicaraan manusia (speech recognition). Selain digunakan untuk alignment, HMM juga digunakan dalam metode-metode analisis sekuens lainnya, seperti prediksi daerah pengkode protein dalam genom dan prediksi struktur sekunder protein.
Enzim restriksi endonuklease mampu melakukan pemotongan pada sekuen yang mirip tetapi tidak identik dengan daerah spesifik pemotongannya. Hilangnya fidelity atau meningkatnya pemotongan pada daerah yang mirip dengan daerah pengenalan resmi (canonical). Enzim restriksi umum dikenal dengan istilah Star Activity, yaitu perubahan pengenalan pada spesifitas enzim restriksi endonuklease yang diperantarai oleh pembelahan DNA yang terjadi akibat perlakuan pada kondisi yang sangat berbeda dari kondisi optimum enzim bekerja. Biasanya hasil yang didapat adalah pemotongan pada sisi pengenalan selain sisi pengenalan spesifik, atau terkadang kehilangan spesifitasnya sama sekali. Dengan meningkatnya star activity maka umumnya akan menurunkan aktivitas pemotongan pada daerah resmi. Misalkan untuk EcoR I, perbedaan laju antara daerah resmi dengan daerah star mendekati nol bersama dengan meningkatnya konsentrasi etilen glikol lebih dari 4M dan pada EcoR V, perbedaan laju turun menjadi hanya enam kali ketika Mg++ digantikan dengan Mn++. 
Beberapa jenis enzim restriksi endonuklease mempunyai sifat star activity, diantaranya: Apo I, Ase I, BamH I, BssH II, EcoR I, EcoR V, Hind III, Hinf I, Pst I, Pvu II, Sal I, Sca I, Taq I, Xmn I, dll. Cara perubahan spesifitas enzim tergantung dari enzim itu sendiri dan juga kondisi yang akan memicu terjadinya star activity. Tipe perubahan spesifitas yang paling sering dijumpai adalah substitusi basa tunggal, pemotongan dari basa terluar pada sekuen pengenalan, dan torehan (nicking) pada untai tunggal. Menunjukan bahwa pada kondisi pH yang dinaikkan dan daya ionic yang rendah, EcoR I akan memotong sekuen N/AATTN, sedangkan pada penelitian yang dilakukan Gardner menunjukan bahwa EcoR I* (EcoR I star activity) memotong pada sisi mana saja yang berbeda dari sekuen pengenalan yang resmi (canonical sequences) dengan cara subtitusi basa tunggal, subtitusi ini tidak terjadi pada (A) menjadi (T) atau (T) menjadi (A), perubahan ini terjadi pada bagian sentral dari sekuen tetranukleotida (AATT).
Contoh enzim retriksi salah satunya adalah enzim AlwI yang merupakan enzim jenis tipe II yang umum, biasanya digolongkan sebagai tipe IIs seperti FokI. Enzim ini memotong di luar situs pengenalan, berukuran sedang, 400-650 asam amino, dan memiliki 2 domain khusus. Domain pertama untuk berikatan dengan DNA, sedangkan domain yang satunya untuk memotong DNA.
Kelebihan dan kekurangan Bioteknologi modern antara lain:
õ  perbaikan sifat genetik dapat dilakukan secara sangat terarah
õ  dapat mengatasi kendala ketidaksesuaian genetik
õ  dapat memeperpendek jangka waktu pengembangan galur tanaman baru
õ  relatif mahal dan memerlukan kecanggihan teknologi
õ  pengaruh jangka panjang belum diketahui

by. Ana Diana Solich - yakin usaha sampai
Referensi :
  • Attwood, T.K., dan D.J. Parry-Smith. 1999. Introduction to Bioinformatics. Harlow: Pearson Education. ISBN 0-582-32788-1
  • Krane, D.E., dan M.L. Raymer. 2003. Fundamental Concepts of Bioinformatics. San Francisco: Benjamin Cummings. ISBN 0-8053-4633-3
  • Mount, D.W. 2001. Bioinformatics: Sequence and Genome Analysis. Cold Spring Harbor: Cold Spring Harbor Laboratory Press. ISBN 0-87969-608-7
  • dan dari berbagai sumber.

1 komentar:

  1. Selamat sore, nama saya Nugi, ssaat ini tengah melakukan penelitian mengenai keragaman genetik dan analisis filogenetik, kalau boleh saya ingin bertanya:
    jika kita mempunyai sekuen DNA dari daerah mitokondria DNA dan akan mengggunakannya dalam analisis filogenetik, apakah outgrupnya (dari species atau subspesies lain) harus menggunakan sekuen yang diperoleh dari jenis primer yang sama? bagaimana jika outgrup diperoleh dari NCBI?
    terima kasih atas perhatiannya
    salam

    BalasHapus