Perbandingan Random Forest dan K-Nearest Neighbor pada Prediksi Nilai Ujian
Keywords:
machine learning, prediksi nilai, random forest, K-Nearest NeighborAbstract
Penelitian ini bertujuan untuk mengidentifikasi faktor-faktor internal dan eksternal yang berpengaruh terhadap nilai ujian siswa serta membandingkan tingkat keakuratan dua algoritma machine learning, yaitu Random Forest dan K-Nearest Neighbor (KNN), dalam memprediksi nilai ujian matematika. Data yang digunakan meliputi nilai ujian matematika siswa kelas 10 dari tahun ajaran 2022/2023 hingga 2024/2025 serta data pendukung dari kuesioner. Penelitian ini menggunakan pendekatan kuantitatif dengan metode Cross Industry Standard Process for Data Mining (CRISP-DM) yang mencakup tahapan business understanding, data understanding, data preparation, modelling, evaluation, dan deployment. Hasil penelitian menunjukkan bahwa faktor nilai UTS memiliki korelasi tertinggi terhadap nilai ujian akhir dengan nilai korelasi sebesar 0,39. Algoritma Random Forest menghasilkan akurasi tinggi pada data pelatihan namun menunjukkan indikasi overfitting, sedangkan algoritma KNN memberikan hasil yang lebih stabil dengan perbedaan kecil antara data pelatihan dan pengujian. Berdasarkan hasil tersebut, algoritma KNN dinilai lebih sesuai digunakan pada dataset dengan ukuran terbatas.