Contoh kasus dan perhitungan manual Algoritma K-Nearest Neighbors (KNN)
TweetSetelah sebelumnya kita berkenalan dengan Algoritma KNN, kali ini kita akan sedikit belajar dengan contoh kasus dan perhitungan manual Algoritma K-Nearest Neighbors (KNN) .
Dalam artikel ini, kita akan mempelajari algoritma K-Nearest Neighbors (KNN) lebih mendalam dengan menggunakan sebuah contoh kasus dan melakukan perhitungan manual. Dengan demikian, Anda akan lebih memahami bagaimana algoritma ini bekerja dan memperoleh gambaran yang lebih jelas tentang implementasinya.
Contoh Kasus: Klasifikasi Bunga Iris
Kita akan menggunakan dataset klasik "Iris" yang sering digunakan dalam pembelajaran machine learning. Dataset ini berisi informasi tentang tiga jenis bunga iris: Iris Setosa, Iris Versicolor, dan Iris Virginica. Setiap instance dalam dataset memiliki empat fitur: panjang sepal, lebar sepal, panjang kelopak, dan lebar kelopak.
Misalkan kita ingin mengklasifikasikan sebuah bunga iris baru dengan menggunakan algoritma KNN. Berikut adalah langkah-langkah yang akan kita ikuti:
- Tentukan nilai k (jumlah tetangga terdekat) Untuk contoh ini, kita akan menggunakan k = 3.
- Ambil data baru yang ingin diklasifikasikan Misalkan data baru yang ingin kita klasifikasikan adalah: Panjang sepal: 5.8 cm Lebar sepal: 2.7 cm Panjang kelopak: 4.1 cm Lebar kelopak: 1.0 cm
- Hitung jarak antara data baru dengan setiap instance dalam dataset pelatihan Untuk mempermudah perhitungan, kita akan menggunakan metrik jarak Euclidean. Jarak Euclidean antara dua titik (x1, y1) dan (x2, y2) dihitung dengan rumus: √((x2 - x1)^2 + (y2 - y1)^2) Misalkan kita memiliki dataset pelatihan dengan 5 instance sebagai berikut:
Instance | Panjang Sepal | Lebar Sepal | Panjang Kelopak | Lebar Kelopak | Jenis |
1 | 5.1 | 3.5 | 1.4 | 0.2 | Setosa |
2 | 6.3 | 2.9 | 5.6 | 1.8 | Virginica |
3 | 5.0 | 3.6 | 1.4 | 0.2 | Setosa |
4 | 7.2 | 3.0 | 5.8 | 1.6 | Virginica |
5 | 6.7 | 3.1 | 4.4 | 1.4 | Versicolor |
Kita akan menghitung jarak Euclidean antara data baru dengan setiap instance dalam dataset pelatihan:
Instance 1: √((5.8 - 5.1)^2 + (2.7 - 3.5)^2 + (4.1 - 1.4)^2 + (1.0 - 0.2)^2) = 2.93
Instance 2: √((5.8 - 6.3)^2 + (2.7 - 2.9)^2 + (4.1 - 5.6)^2 + (1.0 - 1.8)^2) = 2.03
Instance 3: √((5.8 - 5.0)^2 + (2.7 - 3.6)^2 + (4.1 - 1.4)^2 + (1.0 - 0.2)^2) = 3.07
Instance 4: √((5.8 - 7.2)^2 + (2.7 - 3.0)^2 + (4.1 - 5.8)^2 + (1.0 - 1.6)^2) = 2.69
Instance 5: √((5.8 - 6.7)^2 + (2.7 - 3.1)^2 + (4.1 - 4.4)^2 + (1.0 - 1.4)^2) = 1.35
4. Identifikasi k tetangga terdekat Setelah menghitung jarak dengan setiap instance, kita dapat mengidentifikasi k (dalam contoh ini k = 3) tetangga terdekat dari data baru. Jarak terdekat: Instance 5 (1.35), Instance 2 (2.03), Instance 4 (2.69)
5. Tentukan label kelas mayoritas dari k tetangga terdekat Dari 3 tetangga terdekat, kita memiliki: Instance 5: Versicolor Instance 2: Virginica Instance 4: Virginica Karena label kelas "Virginica" muncul dua kali, maka label kelas mayoritas dari 3 tetangga terdekat adalah "Virginica".
Dengan demikian, algoritma KNN akan mengklasifikasikan data baru tersebut sebagai bunga iris jenis "Virginica".
Kesimpulan
Dalam contoh kasus ini, kita telah melihat bagaimana algoritma KNN bekerja secara manual dengan melakukan perhitungan jarak Euclidean antara data baru dengan setiap instance dalam dataset pelatihan. Kita juga telah mengidentifikasi k tetangga terdekat dan menentukan label kelas mayoritas untuk memprediksi jenis bunga iris baru.
Meskipun dalam praktiknya, perhitungan jarak dan identifikasi tetangga terdekat akan dilakukan secara otomatis oleh algoritma KNN dalam bahasa pemrograman atau library machine learning, namun contoh ini memberikan gambaran yang lebih jelas tentang bagaimana algoritma ini bekerja di balik layar.
Pemahaman tentang konsep dasar dan perhitungan manual seperti ini dapat membantu Anda dalam mengimplementasikan algoritma KNN dengan lebih baik dan mengoptimalkan kinerjanya dalam berbagai kasus penggunaan.
Demikian penjelasan singkat dari perhitnguan manual Algoritma K-Nearest Neighbors (KNN) .
Bila teman teman memiliki Skripsi terkait tentang alogritma K-Nearest Neighbors (KNN) bisa menghubungi kami untuk mendapatkan penawaran menarik
Portofolio
Berikut kami tampilkan beberapa portofolio yang pernah kami kerjakan. Lihat Selengkapnya
Oleh : Firda
Tanggal Publikasi :
Bebas DP bagi Skripsi dengan Judul dan Konsep yang Jelas
Sisa Kuota 2
Sisa Waktu : : : :





























