61
Di atas merupakan contoh proses text mining Pertama-tama
dilakukan pengumpulan
dokumen setelah itu text mining tool akan mendapatkan dokumen tertentu dan melakukan
tahapan
preprocess
dengan
mengecek
format
dan set
karakter.
Lalu
akan
masuk
ke
tahapan
analisis teks yang dapat dilakukan berulang-ulang sampai
informasi dapat diekstrak. Pada
gambar,
ada
tiga
bagian
proses
di
dalam analisis
teks,
namun
pada
kenyataannya
banyak
kombinasi teknik yang dapat digunakan tergantung pada hasil yang diinginkan oleh
organisasinya.
Setelah
diekstrak,
informasi
akan
dimasukkan
dalam Management
Information
System,
yang
nantinya
akan
menghasilkan
pengetahuan
yang
banyak
untuk
user dari system
tersebut
2.8.2
Teknologi Text Mining
Walaupun perbedaan dalam bahasa manusia dengan bahasa komputer cukup besar,
namun
ada
teknologi
yang
dapat
menutup
celah
perbedaan
itu.
Pemrosesan
natural
language
telah memproduksi teknologi yang dapat mengajarkan natural language kepada komputer
sehingga
mereka
dapat
menganalisa,
mengerti
dan
bahkan
men-generate
teks.
Beberapa
teknologi
yang
telah
dibuat
dan
bisa
digunakan
yaitu
teknologi information
extraction,
Topic
Extraction, summarization, categorization, clustering, concept linkage, information visualization
dan question answering.
2.8.2.1 Information Extraction
Titik
permulaan
untuk
komputer
menganalisa
teks
yang
tidak
terstruktur
ialah
dengan
menggunakan
extraction
information.
Software
information
extraction
mengidentifikasi
frasa
|