| NIM | K1B021037 |
| Namamhs | EKA PUTRI YUNIARSIH |
| Judul Artikel | KLASIFIKASI PENYAKIT DIABETES MENGGUNAKAN METODE RANDOM FOREST
|
| Abstrak (Bhs. Indonesia) | Diabetes merupakan penyakit metabolik yang ditandai dengan tingginya kadar gula dalam darah. International Diabetes Federation (IDF) mencatat pada tahun 2011 dan 2021 ada sebanyak 366 juta dan 537 juta penderita diabetes dan kematian sebanyak 4,6 juta dan 6,7 juta jiwa. Diagnosis dini perlu dilakukan untuk mengidentifikasi potensi pasien terkena diabetes. Penelitian ini bertujuan untuk mengklasifikasikan diabetes menggunakan machine learning yaitu metode Random Forest dengan tiga rasio data split, yaitu 80:20, 75:25, dan 70:30. Data yang digunakan yaitu Diabetes Prediction Dataset yang diunggah oleh Mohammed Mustafa di Kaggle. Model klasifikasi Random Forest dibentuk berdasarkan kombinasi parameter terbaik yang telah ditentukan yaitu max features, n estimators, max depth, min samples split, dan criterion. Evaluasi kinerja model dilakukan dengan menghitung akurasi ketiga model yang hasilnya berturut-turut yaitu 90,70%, 90,11%, dan 89,71%. Ketiganya menunjukkan performa yang sangat baik dalam mengklasifikasikan pasien negatif dan positif diabetes serta tidak ada perbedaan yang berarti. Implementasi ketiga model dilakukan terhadap dataset baru dan ketiganya memberikan prediksi diabetes yang hampir sama dengan persentase kesamaan antar model lebih dari 99%. Hal ini mengindikasikan bahwa algoritma Random Forest memberikan hasil yang stabil terhadap variasi data split dan layak digunakan untuk mengklasifikasikan penyakit diabetes. |
| Abtrak (Bhs. Inggris) | Diabetes is a metabolic disease characterized by high blood sugar levels. The International Diabetes Federation (IDF) noted that in 2011 and 2021 there were 366 million and 537 million people with diabetes and 4.6 million and 6.7 million deaths. Early diagnosis needs to be done to identify the potential for patients to develop diabetes. This study aims to classify diabetes using machine learning, Random Forest method, with three split data ratios, such as 80:20, 75:25, and 70:30. The data used is “Diabetes Prediction Dataset” uploaded by Mohammed Mustafa on Kaggle. Random Forest classification model is formed based on the best combination of parameters that have been determined, which are max features, n estimators, max depth, min samples split, and criterion. Model performance evaluation is done by calculating accuracy of the three models, the results are 90.70%, 90.11%, and 89.71%. All three models showed excellent performance and there was no significant difference. Implementation of the three models was done on a new dataset and provided almost the same diabetes predictions with a similarity percentage between the models is over 99%. This indicates that the Random Forest algorithm provides stable results against split data variations and is suitable for classifying diabetes. |
| Kata kunci | diabetes, klasifikasi, machine learning, random forest. |
| Pembimbing 1 | Dra. Mutia Nur Estri, M.Kom. |
| Pembimbing 2 | Najmah Istikaanah, S.Si., M.Sc. |
| Pembimbing 3 | |
| Tahun | 2025 |
| Jumlah Halaman | 11 |
| Tgl. Entri | 2025-04-28 10:54:03.906089 |
|---|