Pengaruh Seleksi Fitur Terhadap Akurasi Klasifikasi Indeks Standar Pencemar Udara Menggunakan Naïve Bayes

Authors

  • Rizky Caesar Irjayana Program Studi Magister Informatika, Universitas Ahmad Dahlan
  • Abdul Fadlil Program Studi Teknik Elektro, Universitas Ahmad Dahlan
  • Rusydi Umar Program Studi Informatika, Universitas Ahmad Dahlan

DOI:

https://doi.org/10.33506/insect.v11i1.4303

Keywords:

AQI, Naïve Bayes, K-fold Cross Validation, Classification, Data Mining

Abstract

Tujuan penelitian ini adalah untuk mengklasifikasikan kualitas udara sesuai dengan Indeks Standar Pencemar Udara (ISPU) menggunakan algoritma Naïve Bayes serta mengevaluasi dampak penambahan fitur PM2.5 terhadap akurasi model dengan membagi dataset kedalam tiga kategori diantaranya BAIK, SEDANG dan TIDAK SEHAT. ISPU merupakan indikator penting dalam mengukur kualitas udara berdasarkan konsentrasi polutan seperti PM10, PM2.5, SO2, CO, O3, NO2 dan HC. Dengan tingginya volume data yang dikumpulkan setiap hari, diperlukan metode klasifikasi yang efektif untuk menyampaikan data kualitas udara dengan tepat. Penelitian ini mengusulkan dua skenario klasifikasi berdasarkan Peraturan NOMOR P.14/MENLHK/SETJEN/KUM.1/7/2020, yaitu: tanpa fitur PM2.5 dan dengan fitur PM2.5. Evaluasi dilakukan menggunakan K-Fold Cross Validation dengan K = 2, 3, 4, dan 5, dimana K = 5 menghasilkan akurasi tertinggi. Hasil penelitian menunjukkan bahwa penambahan fitur PM2.5 meningkatkan akurasi model dari 82,89% menjadi 93% dan F1-score dari 82,6% menjadi 92,8%, menunjukkan peningkatan sekitar 10%. Kontribusi utama penelitian ini adalah analisis komprehensif terhadap dampak fitur PM2.5 serta evaluasi berbagai nilai K dalam K-Fold Cross Validation. Dengan demikian, penemuan ini dapat menjadi sumbangsih ilmu pengetahuan pada ranah pengembangan sistem pemantauan kualitas udara yang lebih akurat untuk mendukung kebijakan lingkungan dan kesehatan masyarakat.

References

[1] A. Budiandita, N. Iman, F. M. Hana and C. B. Hakim, “Komparasi Algoritma K-Nearest Neighbor dan Naive Bayes pada Klasifikasi Tingkat Kualitas Udara Kota Tanggerang Selatan,” Jurnal Informatika dan Rekayasa Perangkat Lunak, vol. 6, no. 1, pp. 320-327, 2024. [Online]. Available: https://doi.org/10.36499/jinrpl.v6i1.10956. [Accessed: 01-Mar-2025].

[2] “Air pollution,” Institute For Health Metrics and Evaluation. [Online]. Available: https://www.healthdata.org/research-analysis/health-risks-issues/air-pollution. [Accessed: 01-Mar-2025].

[3] A. A. Anandari, A. F. Wadjdi and G. Harsono, “Dampak Polusi Udara terhadap Kesehatan dan Kesiapan Pertahanan Negara di Provinsi DKI Jakarta,” Journal on Education, vol. 6, no. 2, pp. 10868-10884, 2024. [Online]. Available: https://doi.org/10.31004/joe.v6i2.4880. [Accessed: 01-Mar-2025].

[4] E. H. A. Rady and A. S. Anwar, “Prediction of kidney disease stages using data mining algorithms,” Informatics in Medicine Unlocked, vol. 15, 2019, Art. no. 100178. [Online]. Available: https://doi.org/10.1016/j.imu.2019.100178. [Accessed: 01-Mar-2025].

[5] F. Widiawati, R. Kurniawan and T. Suprapti, “Klasifikasi Data Tingkat Kualitas Udara di Tanggerang Selatan Menggunakan Algoritma Naive Bayes,” Jurnal Mahasiswa Teknik Informatika, vol. 7, no. 6, pp. 3739-3745, 2023. [Online]. Available: https://doi.org/10.36040/jati.v7i6.8261. [Accessed: 01-Mar-2025].

[6] D. D. Purwanto and E. S. Honggara, “Klasifikasi Kategori Hasil Perhitungan Indeks Standar Pencemaran Udara Dengan Gausian Naïve Bayes (Studi Kasus: Ispu Dki Jakarta 2020),” INSYST, vol. 4, no. 2, pp. 102-108, 2022. [Online]. Available: https://doi.org/10.52985/insyst.v4i2.259. [Accessed: 01-Mar-2025].

[7] S. S. A. Umri, M. S. Firdaus and A. Primajaya, “Analisis dan Komparasi Algoritma Klasifikasi dalam Indeks Pencemaran Udara di DKI Jakarta,” Jurnal Informatika dan Komputer, vol. 4, no. 2, pp. 98-104, 2019. [Online]. Available: https://doi.org/10.33387/jiko.v4i2.2871. [Accessed: 01-Mar-2025].

[8] Sunardi, A. Fadlil and N. M. P. Kusuma, “Implementasi Data Mining dengan Algoritma Naïve Bayes untuk Profiling Korban Penipuan Online di Indonesia,” Jurnal Media Informatika Budidarma, vol. 6, no. 3, pp. 1562-1572, 2022. [Online]. Available: https://doi.org/10.30865/mib.v6i3.3999. [Accessed: 01-Mar-2025].

[9] H. A. Ahmed, P. J. M. Ali, A. K. Faeq and S. M. Abdullah, “An Investigation on Disparity Responds of Machine Learning Algorithms to Data Normalization Method,” ARO-THE SCIENTIFIC JOURNAL OF KOYA UNIVERSITY, vol. 10, no. 2, pp. 29-37, 2022. [Online]. Available: https://doi.org/10.14500/aro.10970. [Accessed: 01-Mar-2025].

[10] W. Li and Z. Liu, “A method of SVM with Normalization in Intrusion Detection,” Procedia Environmental Sciences, vol. 11, pp. 256-262, 2011. [Online]. Available: https://doi.org/10.1016/j.proenv.2011.12.040. [Accessed: 01-Mar-2025].

[11] I. Riadi, R. Umar and R. Anggara, “Prediksi Kelulusan Tepat Waktu Berdasarkan Riwayat Akademik Menggunakan Metode Naïve Bayes,” Decode: Jurnal Pendidikan Teknologi Informatika, vol. 4, no. 1, pp. 191-203, 2024. [Online]. Available: https://doi.org/10.51454/decode.v4i1.308. [Accessed: 01-Mar-2025].

[12] A. Peryanto, A. Yudhana and R. Umar, “Klasifikasi Citra Menggunakan Convolutional Neural Network dan K Fold Cross Validation,” JAIC, vol. 4, no. 1, pp. 45-51, 2020. [Online]. Available: https://doi.org/10.30871/jaic.v4i1.2017 . [Accessed: 01-Mar-2025].

[13] I. Riadi, A. Fadlil and B. A. Prabowo, “MAC Address Classification in Privacy Issue Using Gaussian Naïve Bayes,” JUITA: Jurnal Informatika, vol. 12, no. 2, pp. 235-242, 2024. [Online]. Available: https://doi.org/10.30595/juita.v12i2.22571. [Accessed: 01-Mar-2025].

[14] M. Grandini, E. Bagli and G. Visani, “Metrics for Multi-Class Classification: an Overview,” arXiv, 2020. [Online]. Available: https://doi.org/10.48550/arXiv.2008.05756. [Accessed: 01-Mar-2025].

[15] S. Singhal and M. Jena, “A Study on WEKA Tool for Data Preprocessing, Classification and Clustering,” International Journal of Innovative Technology and Exploring Engineering (IJITEE), vol. 2, no. 6, pp. 250-253, 2013. [Online]. Available: https://www.ijitee.org/portfolio-item/f0843052613/. [Accessed: 01-Mar-2025].

Published

30-03-2025

How to Cite

Irjayana, R. C., Fadlil, A., & Umar, R. (2025). Pengaruh Seleksi Fitur Terhadap Akurasi Klasifikasi Indeks Standar Pencemar Udara Menggunakan Naïve Bayes. Insect (Informatics and Security): Jurnal Teknik Informatika, 11(1), 67–78. https://doi.org/10.33506/insect.v11i1.4303

Issue

Section

Articles

Similar Articles

1 2 3 4 5 > >> 

You may also start an advanced similarity search for this article.