2009100121IFbab2 - page 54 of 66

Page 54 of 66

Home Start Back Next End

2.8 Text Mining

2.8.1 Definisi Text Mining

Menurut Weigo Fan (Fan, Weiguo. 2005. hal3-10), Text Mining didefinisikan sebagai penemuan

informasi

baru

yang

belum diketahui

sebelumnya

secara

terkomputerisasi

dengan

mengekstrak

informasi

dari

beberapa

sumber

tertulis

yang

berbeda.

Text

Mining

mirip

dengan

data

mining,

perbedaan

ialah

data

mining

dibuat

untuk

menangani

data

terstruktur

dari

database

atau

file

XML, tetapi text mining dapat bekerja dalam data

yang tidak terstruktur seperti email, dokumen

full-text, file HTML, dan lain-lain. Sebagai hasilnya,

text

mining

merupakan

solusi

yang

lebih

baik untuk perusahaan-perusahaan dimana sejumlah besar informasi yang berbeda-beda harus

disatukan dan diatur.

Masalah pada text mining sudah jelas, natural language

diciptakan

oleh

manusia

untuk

berkomunikasi satu sama lain dan mencatat informasi. Oleh karena itu, komputer sangat sulit

untuk

memahami natural language. Manusia mempunyai kemampuan untuk membedakan dan

memakai

pola

bahasa

pada

teks

dan

dapat

dengan

mudah

mengatasi

masalah

seperti

bahasa

slang, kesalahan eja, dan pengertian konstektual.

Akan tetapi, walaupun kapabilitas bahasa kita

membiarkan

kita

untuk

memahami

data

yang

tidak terstruktur,

kita

mengalami

kesulitan

pada

kemampuan komputer untuk memproses teks pada volume yang besar dengan kecepatan yang

tinggi. Di sini tertera kunci untuk

text mining,

yaitu

membuat

teknologi

yang

dapat

mengkombinasikan

kapabilitas

bahasa

manusia dengan kecepatan dan akurasi yang tinggi pada

komputer.

Gambar 2.8 : Schema Text Mining