Analisis Jenis Pertanyaan Berbahasa Indonesia pada Question and Answering System Menggunakan Metode Support Vector Machine (SVM) cTeknologi Informasi, Sekolah Tinggi Teknik Surabaya, Surabaya, Indonesia email: asakinahsudin80@yahoo.co.id, baikawa@stts.edu, cjoan@stts.edu
Main Article Content
Abstract
Analisis jenis pertanyaan berbahasa Indonesia pada Question and Answering system penting untuk dilakukan guna memprediksi kecocokan pada kelas pertanyaan. Karena setiap pertanyaan berbahasa Indonesa tidak semuanya mengandung awalan kata tanya apa, siapa, mengapa, dimana, kapan dan bagaimana (5W+1H). Dalam penelitian ini terdapat tiga tahap, yaitu : pengumpulan dataset, preprocessing dan melakukan training dan uji coba. Penelitian ini penulis menggunakan algoritma TF-IDF dan metode Support Vector Machine (SVM) untuk klasifikasi. Hasil percobaan yang dilakukan menunjukkan tingkat akurasi klasifikasi mencapai 97%. Kemudian evaluasi kinerja system yang dibangun dengan model confusion matrix memperoleh nilai rata-rata 97% pada data uji 20% dan data latih 80%.