Pengaruh Seleksi Fitur Terhadap Klasifikasi Indeks Standar Pencemar Udara Menggunakan Naïve Bayes

Penulis

  • Rizky Caesar Irjayana Program Studi Magister Informatika, Universitas Ahmad Dahlan
  • Abdul Fadlil Program Studi Teknik Elektro, Universitas Ahmad Dahlan
  • Rusydi Umar Program Studi Informatika, Universitas Ahmad Dahlan

DOI:

https://doi.org/10.33506/insect.v11i1.4303

Kata Kunci:

ISPU, Naïve Bayes, K-fold Cross Validation, Klasifikasi, Data Mining

Abstrak

(Indeks Standar Pencemar Udara) ISPU adalah data parameter yang digunakan untuk mengukur kualitas konsentrasi polutan yang terkadung pada udara, seperti PM10, PM2.5, SO2, CO, O3, NO2 dan HC. Data ini sangat penting dalam penyampaian informasi kualitas udara yang berdampak pada kesehatan masyarakat dan lingkungan. ISPU dikeluarkan oleh Kementerian Lingkungan Hidup dan Kehutanan berdasarkan pada titik-titik pemantauan tiap daerah. Dengan banyaknya data yang terkumpul disetiap lokasi dalam tiap harinya, maka dibutuuhkan pengolahan data kategori yang efektif dalam pengelompokan kualitas udara. Dalam penelitian ini, Naïve Bayes dipilih dalam metode klasifikasi dataset ISPU berdasarkan tiga kategori yaitu, BAIK, SEDANG dan TIDAK SEHAT. Terdapat dua skenario percobaan berdasar pada peraturan NOMOR P.14/MENLHK/SETJEN/KUM.1/7/2020 dimana terdapat penambahan fitur PM2.5 pada data ISPU maka skenario percobaan pertama tanpa menggunakan fitur PM2.5 dan percobaan kedua menggunakan fitur PM2.5. Hasil tertinggi yang diperoleh menggunakan K-Fold Cross Validation dengan K=5 terhadap dua skenario yaitu didapat akurasi sebesar 82,8889% dan f1-score sebesar 82,6% untuk dataset tanpa fitur PM2.5, akurasi sebesar 93% dan f1-score sebesar 92,8% untuk dataset dengan fitur PM2.5. Dapat disimpulkan bahwa penambahan fitur PM2.5 berdasarkan pada peraturan terbaru memiliki dampak positif yaitu kenaikan akurasi dan f1-score mencapai kurang lebih 10%.

Referensi

[1] A. Budiandita, N. Iman, F. M. Hana and C. B. Hakim, “Komparasi Algoritma K-Nearest Neighbor dan Naive Bayes pada Klasifikasi Tingkat Kualitas Udara Kota Tanggerang Selatan,” Jurnal Informatika dan Rekayasa Perangkat Lunak, vol. 6, no. 1, pp. 320-327, 2024. [Online]. Available: https://doi.org/10.36499/jinrpl.v6i1.10956. [Accessed: 01-Mar-2025].

[2] “Air pollution,” Institute For Health Metrics and Evaluation. [Online]. Available: https://www.healthdata.org/research-analysis/health-risks-issues/air-pollution. [Accessed: 01-Mar-2025].

[3] A. A. Anandari, A. F. Wadjdi and G. Harsono, “Dampak Polusi Udara terhadap Kesehatan dan Kesiapan Pertahanan Negara di Provinsi DKI Jakarta,” Journal on Education, vol. 6, no. 2, pp. 10868-10884, 2024. [Online]. Available: https://doi.org/10.31004/joe.v6i2.4880. [Accessed: 01-Mar-2025].

[4] E. H. A. Rady and A. S. Anwar, “Prediction of kidney disease stages using data mining algorithms,” Informatics in Medicine Unlocked, vol. 15, 2019, Art. no. 100178. [Online]. Available: https://doi.org/10.1016/j.imu.2019.100178. [Accessed: 01-Mar-2025].

[5] F. Widiawati, R. Kurniawan and T. Suprapti, “Klasifikasi Data Tingkat Kualitas Udara di Tanggerang Selatan Menggunakan Algoritma Naive Bayes,” Jurnal Mahasiswa Teknik Informatika, vol. 7, no. 6, pp. 3739-3745, 2023. [Online]. Available: https://doi.org/10.36040/jati.v7i6.8261. [Accessed: 01-Mar-2025].

[6] D. D. Purwanto and E. S. Honggara, “Klasifikasi Kategori Hasil Perhitungan Indeks Standar Pencemaran Udara Dengan Gausian Naïve Bayes (Studi Kasus: Ispu Dki Jakarta 2020),” INSYST, vol. 4, no. 2, pp. 102-108, 2022. [Online]. Available: https://doi.org/10.52985/insyst.v4i2.259. [Accessed: 01-Mar-2025].

[7] S. S. A. Umri, M. S. Firdaus and A. Primajaya, “Analisis dan Komparasi Algoritma Klasifikasi dalam Indeks Pencemaran Udara di DKI Jakarta,” Jurnal Informatika dan Komputer, vol. 4, no. 2, pp. 98-104, 2019. [Online]. Available: https://doi.org/10.33387/jiko.v4i2.2871. [Accessed: 01-Mar-2025].

[8] Sunardi, A. Fadlil and N. M. P. Kusuma, “Implementasi Data Mining dengan Algoritma Naïve Bayes untuk Profiling Korban Penipuan Online di Indonesia,” Jurnal Media Informatika Budidarma, vol. 6, no. 3, pp. 1562-1572, 2022. [Online]. Available: https://doi.org/10.30865/mib.v6i3.3999. [Accessed: 01-Mar-2025].

[9] H. A. Ahmed, P. J. M. Ali, A. K. Faeq and S. M. Abdullah, “An Investigation on Disparity Responds of Machine Learning Algorithms to Data Normalization Method,” ARO-THE SCIENTIFIC JOURNAL OF KOYA UNIVERSITY, vol. 10, no. 2, pp. 29-37, 2022. [Online]. Available: https://doi.org/10.14500/aro.10970. [Accessed: 01-Mar-2025].

[10] W. Li and Z. Liu, “A method of SVM with Normalization in Intrusion Detection,” Procedia Environmental Sciences, vol. 11, pp. 256-262, 2011. [Online]. Available: https://doi.org/10.1016/j.proenv.2011.12.040. [Accessed: 01-Mar-2025].

[11] I. Riadi, R. Umar and R. Anggara, “Prediksi Kelulusan Tepat Waktu Berdasarkan Riwayat Akademik Menggunakan Metode Naïve Bayes,” Decode: Jurnal Pendidikan Teknologi Informatika, vol. 4, no. 1, pp. 191-203, 2024. [Online]. Available: https://doi.org/10.51454/decode.v4i1.308. [Accessed: 01-Mar-2025].

[12] A. Peryanto, A. Yudhana and R. Umar, “Klasifikasi Citra Menggunakan Convolutional Neural Network dan K Fold Cross Validation,” JAIC, vol. 4, no. 1, pp. 45-51, 2020. [Online]. Available: https://doi.org/10.30871/jaic.v4i1.2017 . [Accessed: 01-Mar-2025].

[13] I. Riadi, A. Fadlil and B. A. Prabowo, “MAC Address Classification in Privacy Issue Using Gaussian Naïve Bayes,” JUITA: Jurnal Informatika, vol. 12, no. 2, pp. 235-242, 2024. [Online]. Available: https://doi.org/10.30595/juita.v12i2.22571. [Accessed: 01-Mar-2025].

[14] M. Grandini, E. Bagli and G. Visani, “Metrics for Multi-Class Classification: an Overview,” arXiv, 2020. [Online]. Available: https://doi.org/10.48550/arXiv.2008.05756. [Accessed: 01-Mar-2025].

[15] S. Singhal and M. Jena, “A Study on WEKA Tool for Data Preprocessing, Classification and Clustering,” International Journal of Innovative Technology and Exploring Engineering (IJITEE), vol. 2, no. 6, pp. 250-253, 2013. [Online]. Available: https://www.ijitee.org/portfolio-item/f0843052613/. [Accessed: 01-Mar-2025].

Unduhan

Diterbitkan

2025-03-30

Cara Mengutip

Irjayana, R. C., Fadlil, A., & Umar, R. (2025). Pengaruh Seleksi Fitur Terhadap Klasifikasi Indeks Standar Pencemar Udara Menggunakan Naïve Bayes. Insect (Informatics and Security): Jurnal Teknik Informatika, 11(1), 67–78. https://doi.org/10.33506/insect.v11i1.4303

Terbitan

Bagian

Articles

Artikel Serupa

<< < 1 2 3 4 5 > >> 

Anda juga bisa Mulai pencarian similarity tingkat lanjut untuk artikel ini.