Membangun Model Klasifikasi Klasik Menggunakan Logistic Regression pada Dataset Iris
Dalam dunia Machine Learning, klasifikasi adalah salah satu permasalahan yang paling sering dijumpai. Salah satu algoritma paling mendasar namun sangat kuat untuk menyelesaikan masalah klasifikasi biner (dua kelas) adalah Logistic Regression.
Pada artikel kali ini, kita akan membedah secara mendalam kode Python yang mendeteksi apakah sebuah bunga Iris termasuk ke dalam spesies Setosa atau bukan, menggunakan pustaka populer scikit-learn.
1. Source Code Lengkap (Python)
Berikut adalah kodingan lengkap yang kita gunakan untuk memproses data, melatih model, hingga mengevaluasi performanya:
2. Output Terminal
Ketika kode di atas dijalankan, berikut adalah hasil output performa model kita:
3. Penjelasan Detail Baris per Baris
Mari kita bedah alur logika kodingan ini agar lebih mudah dipahami:
A. Transformasi Target Biner
Secara bawaan, dataset Iris memiliki 3 kelas target: Setosa (0), Versicolor (1), dan Virginica (2). Di baris ini:
1, sedangkan spesies lainnya otomatis menjadi 0. Model kita kini hanya fokus menjawab: "Apakah bunga ini Setosa?"B. Pembagian Data (Train-Test Split)
test_size=0.3) sebagai data ujian (x_test & y_test) untuk menguji seberapa pintar model kita nantinya setelah belajar dari 70% data training. random_state=42 memastikan hasil pembagian data selalu konsisten tiap kali kode dijalankan.Kesimpulan
Model Logistic Regression terbukti sangat efektif dan efisien untuk memisahkan jenis bunga Iris Setosa secara linear dari jenis lainnya dengan tingkat akurasi yang absolut pada dataset pengujian ini.




Komentar
Posting Komentar