Klasifikasi Genre Buku Digital Berdasarkan Ringkasan Teks Menggunakan Metode TF-IDF dan Support Vector Machine
Abstrak
Pertumbuhan koleksi buku digital dalam jumlah besar menimbulkan tantangan dalam proses pengelompokan genre secara efektif dan konsisten. Penelitian ini bertujuan untuk mengklasifikasikan genre buku berdasarkan ringkasan teks menggunakan pendekatan text mining. Dataset yang digunakan merupakan Book Genre Dataset yang terdiri atas 4.657 dokumen buku dengan sepuluh kategori genre. Proses penelitian meliputi prapengolahan teks, ekstraksi fitur menggunakan Term Frequency-Inverse Document Frequency, serta pembangunan model klasifikasi menggunakan Support Vector Machine. Data dibagi menjadi data pelatihan sebesar 80% dan data pengujian sebesar 20% dengan metode stratified sampling. Hasil penelitian menunjukkan bahwa model klasifikasi menghasilkan tingkat akurasi sebesar 68,78%, precision sebesar 69,26%, recall sebesar 68,78%, dan F1-score sebesar 68,52%. Genre Fantasy memperoleh performa terbaik dengan nilai F1-score sebesar 0,77, sedangkan genre Romance menunjukkan performa terendah akibat ketidakseimbangan distribusi data dan kemiripan karakteristik teks dengan genre lain. Temuan penelitian menunjukkan bahwa ringkasan buku mengandung informasi yang cukup untuk mendukung proses identifikasi genre secara otomatis. Hasil penelitian berpotensi dimanfaatkan dalam pengembangan perpustakaan digital dan sistem rekomendasi buku berbasis konten.


