Path: Top > S1-Final_Project > Fakultas_Teknik_dan_Ilmu_Komputer > Teknik_Informatika > 2015

Implementasi Text Summarization Menggunakan Metode Vector Space Model Pada Artikel Berita Berbahasa Indonesia

2015
Undergraduate Theses from JBPTUNIKOMPP / 2016-01-05 10:08:03
By : Agung Auliaguntary Arif Putra NIM. 10110237, Perpustakaan UNIKOM
Created : 2016-01-05, with 13 files

Keyword : Ringkasan Teks, Peringkas Teks Otomatis, TF-IDF, Vector Space Model.
Url : http://alumni.unikom.ac.id

Ringkasan adalah suatu pokok permasalahan dari suatu paragraf ataupun suatu dokumen. Dengan melihat sebuah ringkasan saja seorang pembaca dapat memahami garis besar dari suatu berita tanpa perlu membaca keseluruhan berita tersebut. Penggunaan peringkasan teks dapat membantu pembaca dengan cepat dan mudah memahami makna dari sebuah artikel berita tanpa harus membaca keseluruhan teks. Pada penelitian ini terdapat permasalahan untuk melakukan peringkasan dibutuhkan suatu metode untuk mengatasi masalah redudansi kalimat menggunakan metode Vektor Space Model yang nantinya akan terbentuk sebuah ringkasan dari artikel berita berbahasa Indonesia. Metode VSM bermanfaat untuk mengurangi redudansi kalimat pada hasil TF-IDF yang akan diringkas. Analisis sistem peringkas teks otomatis yang dibangun memiliki 3 tahapan yaitu praproses, hitung bobot kata , penentuan ringkasan. Praproses yang dilakukan dalam tahap ini antara lain: pemecahan kalimat, case folding, tokenizing, hapus stopword dan stemming. Tahap kedua adalah melakukan perhitungan bobot menggunakan metode tf-idf dengan menghitung TF(Term Frequency), DF(Document Frequency), dan dihitung weight (W) dari masing-masing term. Tahap ketiga adalah menentukan hasil ringkasan dengan menggunakan metode Vector Space Model. Hasil ringkasan adalah kumpulan dari kalimat-kalimat hasil persentase yang paling tinggi Pengujian dari penelitian ini adalah membuat ringkasan yang dibuat secara manual oleh 3 orang ahli. Ringkasan manual ini digunakan untuk membandingkan hasil ringkasan yang dihasilkan oleh sistem dengan rasio compression 35%.. Untuk menentukan kalimat hasil ringkasan yang relevan ditentukan dengan metode suara terbanyak (majority opinion), artinya bila suatu kalimat dipilih oleh minimal 2 orang peringkas maka kalimat itu relevan untuk dijadikan hasil ringkasan. Hasil ringkasan memiliki akurasi rata-rata nilai precision 72%, recall 65%,dan F-measures adalah sebesar 68% antara hasil ringkasan manual dengan hasil ringkasan oleh sistem.

Description Alternative :

The summary is a subject matter of a paragraph or a document. By looking at a summary of just a reader can understand the outline of a story without the need to read the whole story. The use of text summaries can help readers to quickly and easily understand the meaning of a news article without having to read the entire text. In this study, there are problems to do a summary needed a method to overcome the problem of redundancies sentences using Vector Space Model which will form a compendium of news articles in Indonesian language. VSM method useful for reducing redundancies sentence on TF - IDF results will be summarized. Automatic text summary analysis system that is built has three stages, namely preprocessing, calculate the weight of the word, a summary determination. Preprocessing is done in this phase include: solving sentences, case folding, tokenizing, remove the stopword and stemming. The second stage is to do weight calculation using tf - idf method to calculate TF ( Term Frequency), DF ( Document Frequency), and the calculated weight ( W ) of each term. The third stage is to determine the summary results using the Vector Space Model. Results summary is a collection of sentences highest percentage results. Testing of this research is to create a summary that created manually by 3 experts. Summary this manual is used to compare the results summary generated by the system with a compression ratio of 35%. To determine the sentence summary of relevant results determined using a majority vote majority opinion), meaning that if a sentence is chosen by at least 2 people summary then the sentence was relevant to be the result summary. Summary results have average accuracy precision value 72%, 65% recall, and F -measures amounted to 68% between the summary results of the manual with a summary of the results by the system.

Give Comment ?#(0) | Bookmark

PropertyValue
Publisher IDJBPTUNIKOMPP
OrganizationP
Contact Namedyah@unikom.ac.id
AddressJl. Dipati Ukur No.116 Lt.7
CityBandung
RegionWest Java
CountryIndonesia
Phone022-2533825 ext.112
Fax022-2533754
Administrator E-mailperpus@unikom.ac.id
CKO E-mailperpus@unikom.ac.id