Home
Login.
Artikelilmiahs
50607
Update
KINTAN MAREZKA NURUL QOLBI
NIM
Judul Artikel
TEXT MINING USING TEXTRANK EXTRACTION METHOD AND NAIVE BAYES CLASSIFIER FOR WEB-BASED CLASSIFICATION OF INFORMATICS JOURNALS BASED ON ABSTRACT
Abstrak (Bhs. Indonesia)
Perkembangan teknologi informasi telah menghasilkan lonjakan besar dalam jurnal publikasi ilmiah, yang menyebabkan tantangan dalam menemukan informasi relevan secara cepat dan efisien. Penelitian ini bertujuan untuk mengembangkan sistem klasifikasi jurnal otomatis berbasis web menggunakan metode Textrank dan Naive Bayes Classifier. Metode Textrank digunakan untuk mengekstraksi kata knci penting dari abstrak jurnal, sedangkan Naive Bayes digunakan untuk mengklasifikasikan jurnal ke dalam enam kategori bidang informatika yaitu Kecerdasan Buatan, Rekayasa Perangkat Lunak, Jaringan Komputer, Keamanan Informasi, Sistem Informasi, dan Data Science. Data yang digunakan terdiri dari 180 jurnal sebagai data latih dan 60 jurnal sebagai data uji. Proses klasifikasi melibatkan pra-pemrosesan teks, ekstraksi kata kunci sebanyak 25 kata, dan penghitungan probabilitas menggunakan teorema Bayes. Sistem diuji menggunakan metode black box dan dievaluasi menggunakan confusion matrix. Hasil penelitian menunjukan bahwa kombinasi metode Textrank dan Naive Bayes mampu mengklasifikasikan jurnal dengan tingkat akurasi sebesar 93%, presisi sebesar 82%, dan recall sebesar 81%. Sistem ini diharapkan dapat membantu pengguna dalam menemukan jurnal yang relevan dengan lebih cepat dan efisien.
Abtrak (Bhs. Inggris)
The rapid advancement of information technology has led to a significant increase in scientific publications, creating challenges in efficiently and accurately retrieving relevant information. This study aims to develop a web-based automatic journal classification system using the Textrank and Naïve Bayes Classifier methods. The Textrank method is used to extract important keywords from journal abstracts, while the Naive Bayes Classifier is employed to categorize journal into six informatics-related categories: Artificial Intelligence, Software Engineering, Computer Networks, Information Security, Information Systems, and Data Science. The dataset consists of 180 journals for training and 60 journals for testing. The classification process involves text preprocessing, keyword extraction (up to 25 keywords), and probability calculation using Bayes theorem. The system was tested using the black box method and evaluated through a confusion matrix. The results show that the combination of Textrank and Naive Bayes methods can classify journals with an accuracy of 93%, precision of 82%, and recall of 81%. This system is expected to assist users in finding relevant journals more quickly and efficiently.
Kata kunci
Pembimbing 1
Pembimbing 2
Pembimbing 3
Tahun
Jumlah Halaman
Save