KLASIFIKASI KATEGORI DOKUMEN BERITA BERBAHASA INDONESIA DENGAN METODE KATEGORISASI MULTI-LABEL BERBASIS DOMAIN SPECIFIC ONTOLOGY

Authors

  • Pangestu Widodo Institut Teknologi Sepuluh Nopember
  • Januar Adi Putra Institut Teknologi Sepuluh Nopember
  • Suwanto Afiadi Institut Teknologi Sepuluh Nopember
  • Agus Zainal Arifin Institut Teknologi Sepuluh Nopember
  • Darlis Herumurti Institut Teknologi Sepuluh Nopember

DOI:

https://doi.org/10.33197/jitter.vol2.iss2.2016.100

Keywords:

News document, categorization, multi-label, Ontology, domain-specific

Abstract

[Id]

Sebuah dokumen berita seringkali terkait lebih dari satu kategori, untuk itu diperlukan pemanfaatan metode kategorisasi yang tidak hanya cepat tetapi juga dapat mengelompokkan sebuah berita kedalam banyak kategori. Banyak metode yang dapat digunakan untuk mengkategorisasi dokumen berita, salah satunya adalah ontologi. Pendekatan ontologi dalam kategorisasi sebuah dokumen berita didasarkan pada kemiripan fitur yang ada di dokumen dengan fitur yang ada di ontologi. Penggunaan ontologi dalam kategorisasi yang hanya didasarkan pada kemunculan term dalam menghitung relevansi dokumen menyebabkan banyak kemunculan fitur lain yang sebenarnya sangat terkait menjadi tidak terdeteksi. Dalam? paper ini diusulkan? metode baru untuk kategorisasi dokumen berita? yang terkait dengan banyak kategori, metode ini berbasis domain specific ontology yang perhitungan relevansi dokumen terhadap ontologinya tidak hanya didasarkan pada kemunculan term tetapi juga memperhitungkan relasi antar term yang terbentuk. Uji coba dilakukan pada dokumen berita berbahasa indonesia dengan 2 kategori yaitu olahraga dan teknologi. Hasil uji coba menunjukkan nilai rata-rata akurasi yang cukup tinggi yaitu kategori olahraga adalah 93,85% sedangkan pada kategori teknologi adalah 96,32%.

Kata Kunci: Dokumen berita, kategorisasi, multi-label, ontologi,? domain-spesifik.

[En]

A news document often related? to more than one category,? necessary for utilization? the method of categorization that is not only fast but also able to Classify a news into many categories. Many methods can be used to categorize the news documents, one of which is an ontology. Ontology approach in the categorization of a document is based on the similarity of news features in documents with features that exist in the ontology. The use of ontologies in categorization that just based on the occurance of the term in calculating the relevance of the document, led to the emergence of many other fea-tures that are actually very relevant is undetectable. This paper proposed a new method for categorizing news documents are related with many categories, the method is based on a specific domain ontology and for document relevance calculation is not only based on the occurrence of the term but also take into account the relationships between terms that are formed. Tests performed on the Indonesian language news document with? two categories: sports and technology. The trial results show the value of the average accuracy is high, that the sports category was 93,85% and the technology category is 96,32%.

Keywords : News document, ?categorization, multi-label, Ontology, domain-specific.

Downloads

Download data is not yet available.

Downloads

Published

2016-04-15

How to Cite

[1]
P. Widodo, J. A. Putra, S. Afiadi, A. Z. Arifin, and D. Herumurti, “KLASIFIKASI KATEGORI DOKUMEN BERITA BERBAHASA INDONESIA DENGAN METODE KATEGORISASI MULTI-LABEL BERBASIS DOMAIN SPECIFIC ONTOLOGY”, jitter, vol. 2, no. 2, Apr. 2016.

Issue

Section

Articles