PENGKLASIFIKASIAN TEMA PENELITIAN BERDASARKAN ABSTRAK MENGGUNAKAN VECTOR SPACE MODEL (VSM) DAN K-NEAREST NEIGHBOR (K-NN)

  • Taufik Ramdani
  • Yulison Herry Chrisnanto
  • Asri Maspupah
Keywords: Tema Penelitian, Klasifikasi, Vector Space Model, K-Nearest Neighbor

Abstract

Pada sebuah karya ilmiah yang akan dipublikasikan, tentunya didahului dengan suatu rangkuman kegiatan penelitian yang dikenal sebagai abstrak. Abstrak secara singkat memuat tujuan penelitian, metoda yang digunakan serta hasil yang dicapai pada penelitian. Pengklasifikasian tema ? tema penelitian berdasarkan abstrak dapat memudahkan pengelola dokumen hasil penelitian dalam mengelompokan penelitian berdasarkan tema yang spesifik. Pengelompokan tema dengan jumlah abstrak yang besar memiliki kesulitan tersendiri apabila dikerjakan secara konvensional. Penelitian ini menggunakan metoda Vector Space Model (VSM) dan K-Nearest Neighbor (K-NN) dalam melakukan proses pengklasifikasian tema penelitian berdasarkan abstrak. VSM digunakan untuk praproses abstrak berupa teks dan dilanjutkan menggunakan KNN untuk mengklasifikasi tema penelitian. Jumlah abstrak yang digunakan dalam penelitian ini sebanyak 75 data abstrak sebagai data training dan 25 data sebagai data uji. Jumlah kelas pada proses KNN ditentukan sebanyak 15 kelas yang merepresentasikan jumlah tema penelitian, dengan nilai K ideal ditentukan sebanyak 1, 3, 5, 7 dan 9. Berdasarkan hasil penelitian diperoleh bahwa pengklasifikasian tema penelitian dapat dilakukan dengan akurasi yang baik, dimana algoritma KNN mampu mengelompokan data abstrak ke dalam 15 kelas.

Published
2018-07-03
Section
Articles