Liputan6.com, Jakarta - Sekelompok peneliti di MIT telah memasukkan fitur baru ke dalam algoritma Machine Learning yang dapat meningkatkan kemampuan membuat prediksi. Pendekatan baru ini memungkinkan model komputer memperhitungkan ketidakpastian dalam data yang dianalisis.
Dengan demikian, para peneliti mampu mengidentifikasi beberapa senyawa menjanjikan yang menargetkan protein yang dibutuhkan oleh bakteri penyebab tuberkulosis.
Baca Juga
Advertisement
"Teknik ini adalah bagian dari subbidang Machine Learning, tetapi orang-orang belum [banyak] menerapkannya ke biologi," kata kepala kelompok peneliti di Computation and Biology, CSAIL, MIT, Bonnie Berge dikutip dari keterangannya via Eurekalert, Minggu (18/10/2020).
Penelitian ini, menurut Bonnie, merupakan perubahan paradigma dan secara mutlak merepresentasikan bagaimana eksplorasi metode ini di bidang biologi harus dilakukan.
Machine Learning merupakan jenis pemodelan komputer yang memungkinkan algoritma belajar membuat prediksi berdasarkan data yang telah diolah. Dalam beberapa tahun terakhir, ahli biologi mulai menggunakan Machine Learning untuk menjelajahi basis data besar senyawa obat potensial untuk menemukan molekul yang berinteraksi dengan target tertentu.
Salah satu batasan dari metode ini adalah bahwa meskipun algoritma bekerja dengan baik saat data yang mereka analisis mirip dengan data tempat mereka dilatih, algoritma tidak begitu baik dalam mengevaluasi molekul yang sangat berbeda dari yang telah mereka olah.
Teknik Gaussian
Peneliti mengatasi hal tersebut di atas dengan menggunakan teknik yang disebut proses Gaussian. Teknik ini dapat memberikan nilai ketidakpastian pada data yang dilatihkan algoritma. Dengan begitu, saat model menganalisis data pelatihan, model juga memperhitungkan seberapa andal prediksi tersebut.
Jika data yang masuk ke model memprediksi seberapa kuat molekul tertentu mengikat protein target, serta ketidakpastian prediksi tersebut, misalnya, model dapat menggunakan informasi itu untuk membuat prediksi untuk interaksi target protein yang belum pernah ia olah.
Model ini juga memperkirakan prediksi sendiri. Saat menganalisis data baru, prediksi model mungkin memiliki kepastian lebih rendah untuk molekul yang sangat berbeda dari data pelatihan. Para peneliti dapat menggunakan informasi itu untuk membantu mereka memutuskan molekul mana yang akan diuji secara eksperimental.
Advertisement
Kelebihan
Pendekatan ini memiliki keuntungan dan salah satunya adalah algoritma hanya memerlukan sedikit data pelatihan. Dalam studi ini, tim MIT melatih model dengan kumpulan data 72 molekul kecil dan interaksinya dengan lebih dari 400 protein yang disebut protein kinase.
Mereka kemudian dapat menggunakan algoritme ini untuk menganalisis hampir 11.000 molekul kecil, yang mereka ambil dari basis data ZINC--repositori publik yang memuat jutaan senyawa kimia. Banyak dari molekul ini sangat berbeda dari yang ada di data pelatihan.
Dengan menggunakan pendekatan ini, para peneliti dapat mengidentifikasi molekul dengan perkiraan afinitas pengikatan yang sangat kuat untuk protein kinase yang mereka masukkan ke dalam model.
Ini termasuk tiga kinase manusia, serta satu kinase yang ditemukan di dalam Mycobacterium tuberculosis. Kinase itu, PknB, sangat penting bagi bakteri untuk bertahan hidup, tetapi tidak ditargetkan oleh antibiotik TB garis depan.