Home Start Back Next End
  
60
2.8 Text Mining
2.8.1    Definisi Text Mining
Menurut Weigo Fan (Fan, Weiguo. 2005. hal3-10), Text Mining didefinisikan sebagai penemuan
informasi
baru
yang
belum diketahui
sebelumnya
secara
terkomputerisasi
dengan
mengekstrak
informasi
dari
beberapa
sumber
tertulis
yang
berbeda.
Text
Mining
mirip
dengan
data
mining,
perbedaan
ialah
data
mining
dibuat
untuk
menangani
data
terstruktur
dari
database
atau
file
XML, tetapi text mining dapat bekerja dalam data
yang tidak terstruktur seperti email, dokumen
full-text, file HTML, dan lain-lain. Sebagai hasilnya,
text
mining
merupakan
solusi
yang
lebih
baik untuk perusahaan-perusahaan dimana sejumlah besar informasi yang berbeda-beda harus
disatukan dan diatur.
Masalah pada text mining sudah jelas, natural language
diciptakan
oleh
manusia
untuk
berkomunikasi satu sama lain dan mencatat informasi. Oleh karena itu, komputer sangat sulit
untuk
memahami natural language. Manusia mempunyai kemampuan untuk membedakan dan
memakai
pola
bahasa
pada
teks
dan
dapat
dengan
mudah
mengatasi
masalah
seperti
bahasa
slang, kesalahan eja, dan pengertian konstektual.
Akan tetapi, walaupun kapabilitas bahasa kita
membiarkan
kita
untuk
memahami
data
yang
tidak terstruktur,
kita
mengalami
kesulitan
pada
kemampuan komputer untuk memproses teks pada volume yang besar dengan kecepatan yang
tinggi. Di sini tertera kunci untuk
text mining,
yaitu
membuat
teknologi
yang
dapat
mengkombinasikan
kapabilitas
bahasa
manusia dengan kecepatan dan akurasi yang tinggi pada
komputer.
Gambar 2.8 : Schema Text Mining
Word to PDF Converter | Word to HTML Converter