Liputan6.com, Jakarta Akurasi adalah ukuran seberapa baik sebuah sistem atau model, dalam melakukan klasifikasi atau prediksi dengan membandingkan hasil yang dihasilkan, dengan hasil yang sebenarnya. Dalam dunia statistika dan pembelajaran mesin, akurasi adalah salah satu metrik evaluasi yang paling umum digunakan untuk mengukur performa sebuah model.
Baca Juga
Advertisement
Akurasi sering digunakan dalam konteks klasifikasi biner, di mana model harus memprediksi apakah suatu data masukan termasuk dalam kelas positif atau negatif. Contohnya adalah sistem deteksi spam pada email, di mana model harus memprediksi apakah suatu email merupakan spam atau bukan. Pada kasus ini, akurasi adalah persentase email yang terklasifikasi dengan benar sebagai spam atau tidak spam.
Namun, perlu diingat bahwa akurasi bukanlah satu-satunya metrik evaluasi yang digunakan dalam dunia statistika dan pembelajaran mesin. Terdapat beberapa metrik evaluasi lainnya seperti presisi, recall, dan F1-score, yang dapat digunakan tergantung pada kasus yang sedang dihadapi.
Selain itu, dalam kasus ketidakseimbangan kelas (imbalanced class), di mana jumlah data pada kelas positif dan negatif tidak seimbang, sehingga akurasi adalah ukuran di mana dapat menghasilkan hasil yang salah. Oleh karena itu, penting untuk menggunakan metrik evaluasi yang tepat dan relevan dengan kasus yang sedang dihadapi.
Berikut ini contoh dan rumus akurasi yang Liputan6.com rangkum dari berbagai sumber, Kamis (16/3/2023).
Menghitung Akurasi
Dalam pembelajaran mesin, akurasi adalah ukuran yang digunakan untuk mengukur seberapa baik sebuah model, dalam melakukan klasifikasi atau prediksi pada dataset yang diberikan. Akurasi dapat dihitung dengan membandingkan jumlah prediksi yang benar dengan jumlah total data yang diuji.
Berikut adalah langkah-langkah untuk menghitung akurasi:
- Siapkan dataset yang akan diuji, di mana dataset ini harus terdiri dari data yang sudah memiliki label atau kategori yang sudah diketahui.
- Buat sebuah model yang akan melakukan prediksi pada dataset tersebut. Model ini bisa berupa algoritma pembelajaran mesin, atau model matematis lainnya.
- Lakukan prediksi pada dataset dengan menggunakan model yang telah dibangun, di mana model akan menghasilkan prediksi untuk setiap data pada dataset.
- Bandingkan prediksi yang dihasilkan oleh model dengan label atau kategori yang sebenarnya pada dataset. Jumlah prediksi yang benar, adalah jumlah data yang memiliki prediksi yang sama dengan label yang sebenarnya.
Hitung akurasi dengan rumus:
Akurasi = (Jumlah prediksi benar / Total jumlah data) x 100%
Misalnya, pada sebuah kasus terdapat 100 data yang akan diuji dengan model yang telah dibangun. Dari 100 data tersebut, model berhasil memprediksi dengan benar 85 data. Maka, akurasi model tersebut dapat dihitung sebagai berikut:
Akurasi = (85 / 100) x 100% Akurasi = 85%
Dalam contoh di atas, akurasi model tersebut adalah 85%, yang berarti model tersebut berhasil memprediksi dengan benar 85 dari 100 data yang diuji.
Namun, perlu diingat bahwa akurasi tidak selalu menjadi metrik evaluasi yang tepat dalam semua kasus. Terkadang, akurasi dapat menyesatkan jika dataset yang digunakan memiliki class imbalance, atau jumlah data pada setiap kelas yang tidak seimbang. Sebagai contoh, jika ada 95 data pada kelas A dan hanya 5 data pada kelas B, model yang selalu memprediksi kelas A akan memiliki akurasi sebesar 95%, meskipun model tersebut tidak melakukan prediksi yang baik pada kelas B.
Oleh karena itu, pada kasus seperti itu, metrik evaluasi yang lebih tepat seperti presisi, recall, atau F1-score dapat digunakan untuk mengevaluasi performa model pada setiap kelas secara terpisah. Selain itu, pada beberapa kasus seperti deteksi penyakit langka, presisi mungkin menjadi lebih penting daripada akurasi.
Advertisement
Contoh Penggunaan
1. Di bidang kesehatan
Dalam bidang ini, akurasi sangat penting untuk menentukan diagnosa dan menentukan rencana pengobatan yang tepat. Misalnya, dalam tes pap smear untuk deteksi kanker serviks, akurasi digunakan untuk mengukur seberapa baik tes tersebut dalam membedakan antara sel normal dan sel kanker. Akurasi dalam hal ini dihitung sebagai jumlah hasil tes yang benar positif dan benar negatif, akan dibagi dengan total hasil tes.
2. Di bidang keuangan
Akurasi di bidang keuangan, dapat memperkirakan kemungkinan terjadinya penipuan kartu kredit atau penipuan keuangan lainnya. Akurasi digunakan untuk mengevaluasi seberapa baik model dapat memprediksi transaksi yang mencurigakan. Misalnya, jika suatu model dapat memprediksi dengan tepat 90% transaksi yang mencurigakan, maka akurasi model tersebut adalah 90%. Hal ini dapat membantu perusahaan keuangan, untuk mengidentifikasi dan mencegah penipuan secara lebih efektif.
3. Di bidang teknologi
Akurasi digunakan untuk mengevaluasi kualitas suara, pada alat komunikasi seperti telepon seluler atau perangkat speaker. Akurasi digunakan untuk mengukur seberapa baik suara yang dihasilkan oleh alat tersebut cocok dengan suara asli. Misalnya, jika suara yang dihasilkan oleh alat memiliki akurasi sebesar 95%, maka artinya suara tersebut memiliki kualitas yang sangat baik dan sesuai dengan suara aslinya.
4. Di bidang transportasi
Akurasi digunakan untuk memperkirakan waktu kedatangan kendaraan umum, seperti bus atau kereta api. Akurasi digunakan untuk mengukur seberapa baik perkiraan waktu kedatangan tersebut sesuai dengan waktu sebenarnya. Misalnya, jika perkiraan waktu kedatangan bus memiliki akurasi sebesar 90%, maka artinya perkiraan tersebut sangat akurat dan dapat membantu penumpang untuk merencanakan waktu perjalanan mereka dengan lebih baik.
5. Di bidang pemasaran
Akurasi digunakan untuk memprediksi, apakah suatu produk atau jasa akan disukai oleh pelanggan atau tidak. Akurasi digunakan untuk mengukur seberapa baik model dapat memprediksi preferensi pelanggan. Misalnya, jika model dapat memprediksi dengan tepat 80% preferensi pelanggan terhadap suatu produk, maka artinya model tersebut memiliki akurasi sebesar 80%. Hal ini dapat membantu perusahaan untuk mengembangkan produk atau jasa yang lebih sesuai dengan kebutuhan dan preferensi pelanggan.
Perbedaan dengan Presisi
Presisi dan akurasi adalah dua metrik evaluasi, yang sering digunakan dalam dunia statistika dan pembelajaran mesin, terutama dalam konteks klasifikasi atau prediksi. Akurasi mengukur seberapa baik sebuah model dalam memprediksi kelas yang benar dari keseluruhan data yang diuji. Dalam kasus klasifikasi biner, akurasi dapat dihitung sebagai jumlah prediksi yang benar (True Positive + True Negative) dibagi dengan total jumlah data yang diuji.
Akurasi memberikan gambaran tentang seberapa banyak prediksi yang benar, dibandingkan dengan keseluruhan data yang diuji. Sebagai contoh, sebuah model deteksi spam email memiliki akurasi sebesar 95% dapat diartikan bahwa dari 100 email yang diuji, model tersebut berhasil memprediksi 95 email dengan benar.
Sementara itu, presisi mengukur seberapa baik sebuah model dalam memprediksi data positif dari data yang diprediksi positif. Dalam kasus klasifikasi biner, presisi dapat dihitung sebagai jumlah data positif yang benar terdeteksi sebagai positif (True Positive) dibagi dengan total jumlah data yang diprediksi sebagai positif (True Positive + False Positive). Presisi memberikan gambaran tentang seberapa banyak prediksi positif yang benar, dibandingkan dengan total prediksi positif yang dilakukan. Sebagai contoh, sebuah model deteksi spam email memiliki presisi sebesar 90% dapat diartikan bahwa dari 100 email yang diprediksi sebagai spam, 90 email benar-benar spam.
Perbedaan utama antara akurasi dan presisi adalah bahwa akurasi mengukur performa keseluruhan model dalam melakukan klasifikasi, sementara presisi lebih fokus pada performa model dalam memprediksi data positif. Meskipun kedua metrik evaluasi ini penting dalam mengevaluasi performa sebuah model, namun dalam beberapa kasus, presisi lebih relevan daripada akurasi. Misalnya, pada kasus deteksi penyakit langka di mana jumlah data positif sangat sedikit, presisi menjadi lebih penting daripada akurasi. Oleh karena itu, dalam mengevaluasi performa sebuah model, penting untuk mempertimbangkan kedua metrik evaluasi ini dan memilih yang paling relevan dengan kasus yang sedang dihadapi.
Advertisement