Analisis Komparatif Jarak Euclidean, Manhattan, Canberra, Chebyshev, Cosine pada K-Means untuk Evaluasi Kepuasan Masyarakat

Fakhri Fakhri; Iis afrianty; Elvia Budianita; Fadhilah Syafria; Siska Kurnia Gusti; Salmiyati Salmiyati

doi:10.47065/tin.v7i1.10086

Fakhri Fakhri Universitas Islam Negeri Sultan Syarif Kasim Riau, Pekanbaru, Indonesia
Iis afrianty * Universitas Islam Negeri Sultan Syarif Kasim Riau, Pekanbaru, Indonesia
Elvia Budianita Universitas Islam Negeri Sultan Syarif Kasim Riau, Pekanbaru, Indonesia
Fadhilah Syafria Universitas Islam Negeri Sultan Syarif Kasim Riau, Pekanbaru, Indonesia
Siska Kurnia Gusti Universitas Islam Negeri Sultan Syarif Kasim Riau, Pekanbaru, Indonesia
Salmiyati Salmiyati Universitas Islam Negeri Sultan Syarif Kasim Riau, Pekanbaru, Indonesia

(*) Corresponding Author

DOI: https://doi.org/10.47065/tin.v7i1.10086

Keywords: K-Means Clustering; Distance Comparison; Davies-Bouldin Index; Silhouette Score; Community Satisfaction

Abstract

The selection of distance metrics in the K-Means Clustering algorithm can affect the quality of clustering results, particularly on public satisfaction data measured using a Likert scale. This study aims to compare the performance of five distance metrics, namely Euclidean Distance, Manhattan Distance, Canberra Distance, Chebyshev Distance, and Cosine Similarity, in clustering the level of public satisfaction toward public services. The research data were obtained from 533 respondents who used the services of the Mal Pelayanan Publik (MPP) Pekanbaru through a questionnaire consisting of 23 questions based on the SERVQUAL dimensions and the Community Satisfaction Survey indicators in accordance with PERMEN PAN-RB Number 14 of 2017. After the data cleaning process, one duplicate record was removed, resulting in 532 respondent records used in the analysis stage. The number of clusters was determined using the Elbow Method, while cluster quality was evaluated using the Davies-Bouldin Index (DBI) and Silhouette Score. The results show that Manhattan Distance with k=2 produced the lowest DBI value of 0.8144, whereas Euclidean Distance with k=3 produced the highest Silhouette Score of 0.5088. The clustering results formed groups of respondents with different satisfaction levels, namely Dissatisfied, Satisfied, and Very Satisfied. This study contributes an evaluative comparison of five distance metrics in the K-Means algorithm using two evaluation approaches simultaneously, namely the Davies-Bouldin Index and Silhouette Score, on public satisfaction data based on a Likert scale. The results indicate that the performance of distance metrics may differ depending on the evaluation method used, therefore the selection of distance metrics should consider the characteristics of the data and the objectives of the analysis.The difference in evaluation results indicates that DBI and Silhouette Score assess clustering quality from different aspects. Based on the findings, Manhattan Distance and Euclidean Distance demonstrated better performance compared to other distance metrics on the dataset used, and can therefore be considered in the analysis of public satisfaction toward public services.

Downloads

Download data is not yet available.

References

Agung Nugraha, Odi Nurdiawan, & Gifthera Dwilestari. (2022). Penerapan Data Mining Metode K-Means Clustering Untuk Analisa Penjualan Pada Toko Yana Sport. JATI (Jurnal Mahasiswa Teknik Informatika), 6(2), 1–7. https://doi.org/10.36040/jati.v6i2.5755

Baha’uddin, M., & Fatah, Z. (2024). Penerapan Data Mining Clustering K-Means Dalam Mengelompokkan Data Penduduk Penyandang Disabilitas. Gudang Jurnal Multidisiplin Ilmu, 2(10), 86–94. https://doi.org/10.59435/gjmi.v2i11.1040

Diastuti, A., & Ayyustia, R. (2025). Strategi Peningkatan Mutu Pelayanan Publik melalui Inovasi Digital di Kelurahan Sunter Agung. 2(2), 109–126. https://doi.org/https://doi.org/10.62383/presidensial.v2i2.721

Farida, J. I., & Lubis, A. H. (2025). Grouping Of Tourism Locations In Indonesia Using Distance Variations In The K-Means Algorithm. 8(3), 42–50. https://doi.org/10.31289/jite.v8i3Spc.14528

Golzar, J., & Noor, S. (2022). Convenience Sampling. International Journal of Education & Language Studies, 1(2), 72–77. https://doi.org/10.22034/IJELS.2022.162981

Gunadi, I. G. A., & Wirawan, I. M. A. (2025). Studi Perbandingan Algoritma Euclidean, Manhattan dan Chebyshev Distance untuk Optimasi Metode K-Means Clustering pada Pengelompokkan Data Penerimaan Mahasiswa Baru. Jurnal Pendidikan Teknologi Dan Kejuruan, 22(2), 116–127. https://doi.org/10.23887/jptk-undiksha.v22i2.98863

Harahap, M. I., Suliawati, S., & Sibuea, S. R. (2024). Pengaruh Kualitas Pelayanan Pembuatan Surat Keterangan Catatan Kepolisian (SKCK) Terhadap Kepuasan Masyarakat dengan Menggunakan Metode Regresi Linier Berganda di Polrestabes Medan. Journal of Research and Development on Public Policy, 3(2), 213–233. https://doi.org/10.58684/jarvic.v3i2.164

Hartono, B., & Lusiana, V. (2026). Analisis Metode Elbow SSE , Silhouette Score , dan Jaccard Stability dalam Pemilihan Jumlah Klaster Data yang Optimal TIN : Terapan Informatika Nusantara. 6(8), 1521–1532. https://doi.org/10.47065/tin.v6i8.9271

Hayuningtyas, H. Y., & Monoarfa, A. (2023). Analisis Pelaksanaan Pelayanan Publik. JIANA (Jurnal Ilmu Administrasi Negara), 21(1), 31–39. https://doi.org/10.46730/jiana.v21i1.8090

Herdiana, I., Kamal, M., Triyani, Estri, M., & Renny. (2025). A More Precise Elbow Method for Optimum K-Keans Clustering. 1–22. https://doi.org/10.48550/arXiv.2502.00851

Hidayati, R., Zubair, A., Pratama, A. H., & Indana, L. (2021). Analisis Silhouette Coefficient pada 6 Perhitungan Jarak K-Means Clustering. Tecno.COM, 20(2), 186–197. https://doi.org/10.33633/tc.v20i2.4556

Ikhsan, T., Haerani, E., Wulandari, F., & Syafria, F. (2025). Clustering Data Penduduk Menggunakan Algoritma K-Means TIN : Terapan Informatika Nusantara. 5(12), 679–687. https://doi.org/10.47065/tin.v5i12.7328

Iqbal, M., Syaripuddinn, & Nurul, M. (2023). Implementasi Algoritma K-Means Clustering dengan Jarak Euclidean dalam Mengelompokkan Daerah Penyebaran. 2(1), 47–56. https://doi.org/10.30872/basis.v2i1.1019

Kaligis, G. B., & Yulianto, S. (2022). Analisa Perbandingan Algoritma K-Means, K-Medoids, dan X-Means Untuk Pengelompokkan Kinerja Pegawai. Jurnal Penerapan Teknologi Informasi Dan Komunikasi, 01(03), 179–193. https://doi.org/10.24246/itexplore.v1i3.2022.pp179-193.

Khoirala, A., Pily, E., Rio, U., & Tashid. (2025). Komparasi K-Means Clustering dengan Euclidean dan Cosine Similarity untuk Segmentasi dan Rekomendasi Produk pada Data E-Commerce Annisa. The Indonesian Journal of Computer Science, 14(2), 3032–3055. https://doi.org/10.33022/ijcs.v14i2.4713

Kinanti, R., Jasmir, & Fachruddin. (2024). Penerapan Metode Clustering K-Means Untuk Menentukan Prioritas Penerima Bantuan Program Beras Untuk Rakyat Miskin (RASKIN) Studi Kasus: Kecamatan Siluak. Jakakom, 4(2), 2808–5469. https://doi.org/10.33998/jakakom.v4i2

Lopez-miguel, I. D. (2021). Survey on Preprocessing Techniques for Big Data Projects. Engineering Proceedings, 7(1). https://doi.org/10.3390/engproc2021007014

Oop Sofiyah, S., R., N., & Danar Dana, R. (2023). Analisis Efektivitas Pelayanan Publik Menggunakan K-Means Clustering Di Kecamatan Sukagumiwang. JATI (Jurnal Mahasiswa Teknik Informatika), 7(2), 1291–1296. https://doi.org/10.36040/jati.v7i2.6536

Permata, R. P., Alifah, A. N., & Sanjaya, I. M. W. A. (2025). Optimizing K-Means Clustering through Distance Metric Simulation for Strategic Enrollment Segmentation in Private Universities. Jurnal Matematika Murni Dan Aplikasi, 10(2), 616–629. https://doi.org/10.18860/cauchy.v10i2.33089

Prasetyo, D., Muchsin, S., & Suyeno. (2022). Efektifitas Mal Pelayanan Publik Dalam Peningkatan Kualitas Pelayanan Publik. Jurnal Respon Publik, 16(10), 1–6. https://jim.unisma.ac.id/index.php/rpp/article/view/18732

Supawanhar, Putri, S., & Febriansah, R. (2024). Pengukuran Indeks Kepuasan Masyarakat Perizinan E - Mal Pelayanan Publik (MPP) Kota Bengkulu. Journal of Governance and Public Administration, 1(4), 563–578. https://doi.org/10.70248/jogapa.v1i4.1237

Supriyanto, D. F., Prabowo, S., Widodo, A. S., & Eldo, D. H. A. P. (2021). Analisis Kinerja Pelayanan Publik di Masa Pandemi (Studi Pelayanan Kartu Tanda Penduduk Elektronik (E-KTP) Kabupaten Karawang). Jurnal Ranah Publik Indonesia Kontemporer (Rapik), 1(1), 40–49. https://doi.org/10.47134/rapik.v1i1.8

Sutirta, N. F., & Noviandi. (2024). Perbandingan Manhattan dan Euclidean Distance Untuk Pengelompokan Penyakit Jantung Menggunakan Algoritma K-Means. ICIT Journal, 10(1), 61–70. https://doi.org/10.33050/icit.v10i1.2860

Wisanta, E. H., & Marlim, Y. N. (2021). Analisis Algoritma K-Means Untuk Clustering Kepuasan Pelayanan: Mall Pelayanan Publik Pekanbaru. Seminar Nasional Informatika, 223–228. https://ejournal.pelitaindonesia.ac.id/ojs32/index.php/SENATIKA/article/view/1160

Yusuf, B., Mahara, R., Ahmadian, H., Wahyuni, S., & AR, K. (2022). Analisis Clustering Penduduk Miskin Di Provinsi Aceh Menggunakan Algoritma K-Means Dan X-Means. Jurnal Nasional Komputasi Dan Teknologi Informasi, 5(1), 26–35. https://doi.org/10.32672/jnkti.v5i1.3961

Bila bermanfaat silahkan share artikel ini

Berikan Komentar Anda terhadap artikel Analisis Komparatif Jarak Euclidean, Manhattan, Canberra, Chebyshev, Cosine pada K-Means untuk Evaluasi Kepuasan Masyarakat

Analisis Komparatif Jarak Euclidean, Manhattan, Canberra, Chebyshev, Cosine pada K-Means untuk Evaluasi Kepuasan Masyarakat

Abstract

Downloads

References

Most read articles by the same author(s)