Home
Login.
Artikelilmiahs
42657
Update
MUHAMMAD FIKRA ADZAKY
NIM
Judul Artikel
Optimasi Performa Klasifikasi Data Sel Blast Tak Seimbang menggunakan Metode Graph Clustering berbasis DPClusSBO
Abstrak (Bhs. Indonesia)
Dewasa ini sering dijumpai pemanfaatan teknologi machine learning dalam bidang medis. Salah satunya adalah penggunaan metode klasifikasi untuk mengenali suatu sampel atau membantu dalam diagnosa penyakit pada sel darah. Metode klasifikasi machine learning dapat mengenali kelainan dan perbedaan pada citra objek atau gambar sel darah putih (leukosit). Penyakit leukemia biasa dibedakan menjadi dua jenis yakni acute myeloid leukemia (AML) dan acute lymphoblastic leukemia (ALL). Sebagai suatu penyakit akut tentunya dalam ketersediaan dataset yang berlabel akan cukup sulit untuk diperoleh. Bila ada, seringkali dataset yang diperoleh adalah data yang tidak seimbang (imbalance). Hal ini akan memengaruhi performa klasifikasi dalam beberapa aspek sehingga kurang optimal dalam penggunaannya. Salah satu upaya menangani kasus ketidakseimbangan data ini adalah dengan melakukan penuruan sampel (undersampling) pada salah satu kelas data mayoritas. Teknik ini bertujuan menyeimbangkan distribusi data keseluruhan antara data mayoritas dengan data minoritas. Teknik undersampling yang dipilih adalah metode analisis metrik jarak pada graph clustering yang dijalankan pada perangkat lunak DPClusSBO. Penelitian ini menghasilkan metode penanganan untuk meningkatkan performa proses klasifikasi pada data sel blast yang tak seimbang (imbalance). Performa yang dinilai bukan hanya dari akurasi namun juga parameter seperti AUC, ROC, F-measure, dan G-means. Berikutnya metode ini dapat diterapkan pada klasifikasi sel blast yang menggunakan metode support vector machine (SVM), k-nearest neighbor (k-NN), naïve bayes, dan random forest classifier. Selain itu, harapannya metode pada penelitian ini juga dapat diterapkan pada kasus-kasus data tak seimbang lainnya.
Abtrak (Bhs. Inggris)
Seeing machine learning technology in the medical field is an everyday thing. One of them is classification methods to identify a sample or to assist in diagnosing diseases of blood cells. The machine learning classification method can recognize abnormalities and differences in white blood cell (leukocytes) images. There are two types of leukemia, acute lymphoblastic leukemia, and acute myeloid leukemia. The cost of clinical health-labeled datasets tends to be high and less affordable. On the other hand, the dataset obtained often is imbalanced data. Thus, it will affect classification performance in several aspects. To address this imbalanced data problem, we will perform undersampling in the majority data class. This technique balances the overall data distribution between majority data and minority data. We use distance metric analysis in graph clustering-based undersampling. This method will be executed in DPClusSBO software. This research produces a handling method to improve the performance of the classification process on imbalanced blast cell data. Performance is assessed not only from accuracy. There are also parameters such as AUC, ROC, F-measure, and G-means. Furthermore, this method can be applied to blast cell classification using support vector machine (SVM), k-nearest neighbor (k-NN), naïve Bayes, and random forest classifier methods.
Kata kunci
Pembimbing 1
Pembimbing 2
Pembimbing 3
Tahun
Jumlah Halaman
Save