Path: Top > S1-Final_Project > Fakultas_Teknik_dan_Ilmu_Komputer > Teknik_Informatika > 2015

Penerapan Analisis Outlier Untuk Pengelompokan Jurnal Ilmiah Menggunakan Metode Hierarchical Clustering Dan K-Means Di Lembaga Ilmu Pengetahuan Indonesia LIPI

2015
Undergraduate Theses from JBPTUNIKOMPP / 2016-01-07 14:49:59
By : Valentinus Silalahi NIM. 10109615, Perpustakaan UNIKOM (valentinus.silalahi@gmail.com)
Created : 2016-01-07, with 13 files

Keyword : text-mining, clustering, K-Means, Analysis Outlier
Url : http://alumni.unikom.ac.id

Pesatnya perkembangan teknologi media penyimpanan digital telah mendorong terjadinya ledakan jumlah dokumen elektronik yang tersimpan dalam repository di lembaga ilmu pengetahuan Indonesia. Berbagai artikel ilmiah dari berbagai peneliti dan kalangan masyarakat telah tersedia dalam versi digital. Namun, fenomena ini tidak disertai dengan pertumbuhan jumlah informasi atau pengetahuan yang dapat disarikan dari dokumen-dokumen elektronik tersebut, Text mining merupakan metode untuk mencari informasi baru yang berguna dari sekumpulan data yang berjumlah besar dan dapat membantu dalam mengambil keputusan. Dalam text mining terdapat beberapa metode yaitu estimation, prediction, classification, clustering dan association. Dalam tugas akhir ini akan diterapkan metode clustering dengan penggabungan algoritma hierarchical-clustering dan algoritma k-means. Clustering merupakan teknik mengelompokan data dengan melakukan pemisahan data ke dalam sejumlah kelompok menurut karakteristik tertentu, dimana label dari setiap data belum diketahui dan dengan pengelompokan tersebut diharapkan dapat mengetahui kelompok data untuk kemudian diberi label sesuai permasalahan yang dihadapi. Pada dataset yang memiliki banyak obyek dimungkinkan adanya beberapa obyek yang memiliki perbedaan karakteristik dengan yang lainnya, obyek ini disebut outlier. Jumlah outlier yang sedikit dari banyaknya objek menyebabkan outlier sulit untuk terdeteksi. Sedangkan tidak jarang ada informasi penting yang dapat digunakan dari keanomalian tersebut. Clustering dapat digunakan untuk menganalisa keberadaa outlier. Oleh sebab itu, Pusat Penelitian Informatika – LIPI memerlukan metode clustering untuk dapat menggunakan tumpukan artikel ilmiah tersebut, untuk mendapatkan suatu informasi yang digunakan sebagai acuan dalam mengakses informasi, mengkaji artikel ilmiah, memetakan, memonitoring, mengarahkan dan mengevaluasi informasi.

Description Alternative :

The rapid development of digital storage media technology has led to the explosion of electronic documents stored in the repository in science institution of Indonesia. Various scientific articles from various researchers and the community has been available in a digital version. However, this phenomenon is not accompanied by a growth in the amount of information or knowledge that can be extracted from the electronic documents, Text mining is a method to find new useful information from a collection of large amounts of data and can assist in making decisions. In text mining, there are several methods of estimation, prediction, classification, clustering and association. In this final project will be implemented by merging algorithm clustering method hierarchical clustering and k-means algorithm. Clustering is a technique of grouping data by separating the data into several groups according to certain characteristics, which the label of any data not yet known and the grouping is expected to determine the group of data for later labeled according to the problems faced. In the dataset that has a lot of objects is possible for some of the objects that have different characteristics with each other, these objects are called outliers. The number of outliers that few of the many objects causing outliers difficult to be detected. While not uncommon to have important information that can be used from the outliers. Clustering can be used to analyze the presence of outliers. Therefore, the Research Center for Informatics - LIPI require clustering method to be able to use the pile of scientific articles, to get some information used as a reference in accessing information, reviewing scientific articles, mapping, monitoring, directing and evaluating information.

Give Comment ?#(0) | Bookmark

PropertyValue
Publisher IDJBPTUNIKOMPP
OrganizationP
Contact Namedyah@unikom.ac.id
AddressJl. Dipati Ukur No.116 Lt.7
CityBandung
RegionWest Java
CountryIndonesia
Phone022-2533825 ext.112
Fax022-2533754
Administrator E-mailperpus@unikom.ac.id
CKO E-mailperpus@unikom.ac.id