Path: Top > S1-Final_Project > Fakultas_Teknik_dan_Ilmu_Komputer > Teknik_Informatika > 2016

Otomasi Pembentukan Abstrak Bahasa Indonesia Berdasarkan Keseluruhan Dokumen Menggunakan Term Frequency-Inverse Document Frequency (TF-IDF)

2016
Undergraduate Theses from JBPTUNIKOMPP / 2016-06-03 10:17:02
By : Arie Prima Anggara NIM. 10110038, Perpustakaan UNIKOM (arieprimaa@gmail.com)
Created : 2016-06-03, with 13 files

Keyword : Term Frequency – Inverse Document Frequency (TF-IDF), Kecerdasan Buatan, Pembentukan Abstrak Otomatis.
Url : http://alumni.unikom.ac.id

Abstrak adalah sebuah ringkasan dari keseluruhan dokumen penelitian agar pembaca tahu maksud dari penelitian tersebut. Dari abstrak, pembaca dapat mengetahui jalan pikiran penulis laporan/artikel ilmiah tersebut dan mengetahui gambaran umum tulisan secara lengkap. Dalam membentuk paragraf abstrak pada sebuah dokumen jurnal dari setiap sub bab tentunya membutuhkan pencarian kalimat yang singkat dan jelas. Pencarian kalimat pada setiap sub bab dalam dokumen jurnal yang banyak akan membantu penulis laporan/artikel ilmiah dalam membentuk abstrak dengan keterbatasan pembentukan abstrak harus singkat, bagian harus seimbang dan menghindari kalimat yang panjang. Dalam penelitian ini dibangun sistem pembentukan abstrak secara otomatis dengan menerapkan metode Term Frequency – Inverse Document frequency. Metode Term Frequency – Inverse Document Frequency (TF-IDF) akan mencari kalimat pada sub judul pendahuluan, analisis, dan kesimpulan sehingga akan terbentuklah kalimat abstrak secara otomatis dengan mengutamakan isi kalimat yang berada pada sub judul tersebut. Analisis sistem pembentukan abstrak otomatis yang dibangun memiliki 3 tahapan yaitu input jurnal, praproses, pembentukan abstrak. Input jurnal yang dipilih berupa jurnal berformat doc. Praproses yang dilakukan dalam tahap ini adalah pemecahan kalimat, case folding, filtering, tokenizing, synonim checking, dan stopword. Tahap selajutnya melakukan perhitungan menggunakan tf-idf dan tahap terakhir menentukan hasil abstrak dengan metode cosine similarity. Berdasarkan hasil pengujian, maka dilakukan tahap pengujian terhadap sistem dan secara manual. Maka diperoleh jarak antara hasil manual dengan sistem rata-rata hanya berbeda 2 sampai 4 kalimat saja. Akurasi dengan persentase 100% didapat oleh jurnal ke 7 dan 9 sedangkan akurasi dengan pesentase terendah 60% didapat oleh jurnal ke 1.

Description Alternative :

Abstract is a summary of the overall research documents so that readers know the purpose of the study. From the abstract, the reader can know the mind of the writer reports / scientific articles and know the general picture of the complete article. In forming an abstract paragraph in a document journal of each section would require finding short sentences and clear. Search sentence on each section in the document that the journal would deprive many authors report / scientific articles in abstract form with limited formation of the abstract should be brief, sections should be balanced and avoid long sentences.On the problems it is constructed abstract formation system automatically applies the method Term Frequency – Inverse Document Frequency. TF-IDF method will seek a sentence on the subtitles introduction, analysis, and conclusions that will form the abstract sentence automatically with emphasis on the content of the sentence that is on the subtitles. Formation abstract automated analysis system that is built has three stages, namely the input journal, preprocessing, abstract formation. Input journal chosen in the form of a journal format doc. preprocessing is done in this phase is the breakdown of the sentence, case folding, filtering, tokenizing, synonim checking, and stopword. Hereinafter stage performing calculations using tf-idf and last stage of determining the outcome abstract cosine similarity method. Based on test results, then do the testing phase of the system and manually. Then the distance between the results obtained manually by an average system differs only 2 to 4 sentences. 100 % accuracy with the percentage obtained by the journal to 7 and 9 while pesentase accuracy with the lowest 60 % earned

Give Comment ?#(0) | Bookmark

PropertyValue
Publisher IDJBPTUNIKOMPP
OrganizationP
Contact Namedyah@unikom.ac.id
AddressJl. Dipati Ukur No.116 Lt.7
CityBandung
RegionWest Java
CountryIndonesia
Phone022-2533825 ext.112
Fax022-2533754
Administrator E-mailperpus@unikom.ac.id
CKO E-mailperpus@unikom.ac.id