ANALISIS PENGELOMPOKAN NEGARA BERDASARKAN INDIKATOR PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS
Abstract
Penelitian ini bertujuan untuk menganalisis kondisi pendidikan antar negara dengan menggunakan pendekatan unsupervised learning, khususnya algoritma K-Means Clustering. Fokus utama penelitian ini adalah mengelompokkan lima negara secara acak berdasarkan tiga indikator pendidikan: Tingkat Melek Huruf Orang Dewasa, Persentase Penyelesaian Pendidikan Dasar, dan Angka Partisipasi Pendidikan Dasar. Data diambil dari sumber global terbuka dan diproses melalui tahapan pra-pemrosesan, seperti penghapusan data kosong dan normalisasi menggunakan Z-Score. Proses klasterisasi dilakukan dengan jumlah klaster sebanyak tiga, dilanjutkan dengan reduksi dimensi menggunakan Principal Component Analysis (PCA) untuk keperluan visualisasi. Hasil clustering menunjukkan bahwa negara-negara dapat dikelompokkan ke dalam tiga kategori besar: negara dengan kualitas pendidikan rendah, menengah, dan tinggi. Contohnya, negara seperti Sub-Saharan Africa masuk dalam klaster dengan indikator pendidikan rendah, sedangkan Central Europe and the Baltics masuk ke dalam klaster dengan capaian indikator pendidikan sangat tinggi. Visualisasi dua dimensi menggunakan PCA memperkuat validitas pembagian klaster dengan pemisahan yang jelas antar kelompok. Penelitian ini memberikan kontribusi awal dalam menganalisis dan memetakan kondisi pendidikan global secara kuantitatif, yang dapat menjadi dasar pertimbangan dalam studi komparatif pendidikan dan perumusan kebijakan. Dengan memahami karakteristik tiap klaster, negara-negara dengan capaian rendah dapat belajar dari strategi negara-negara yang lebih unggul dalam membangun sistem pendidikan yang lebih baik dan merata.
Kata Kunci: K-Means, clustering, pendidikan, PCA, melek huruf, partisipasi pendidikan dasar, analisis data