62
kunci dan hubungan dalam teks. Ini dilakukan dengan
mencari urutan yang telah
didefinisakan
sebelumnya
di
dalam teks,
sebuah
proses
yang
disebut
pattern
matching.
Software
ini
dapat
menyimpulkan
hubungan di antara objek yang telah terdefinisi
untuk
memberikan user
informasi
yang
bermakna.
Teknologi
ini
sangat
berguna untuk
volume
data
yang
besar.
Hampir
semua
software text mining menggunakan information extraction karena ini merupakan dasar dari
semua teknologi text mining yang ada.
1. Topic Extraction
Sistem
Topic
Extraction
bekerja
dengan
menyimpan
profil
user
dan
berdasarkan
dokumen
yang
user
lihat,
lalu
memprediksi
dokumen
lain
yang
memiliki
daya
tarik
untuk
user tersebut.
Teknologi Topic Extraction mempunyai keterbatasan pada tingkatan
akurasinya.
Beberapa
text
mining
tool
yang baik
memungkinkan
user
untuk
memilih
kategori
tertentu
atau software
secara
otomatis
dapat
menarik
kesimpulan
dari
ketertarikan
user berdasarkan sejarah bacaan user dan
informasi
yang dicari
user
melalui
penekanan tombol mouse.
2. Summarization
Text summarization sangat membantu untuk mengetahui apakah sebuah dokumen yang
panjang termasuk dalam kriteria yang dibutuhkan oleh user dan cocok untuk terus
dibaca. Kunci dari summarization
ialah
mengurangi panjang dan detail dari dokumen
namun tetap menjaga maksud inti dan keseluruhan. Tantangannya terletak di sana,
walaupun komputer mampu untuk menentukan pelaku,
tempat, dan
waktu,
namun tetap
sulit untuk mengajarkan software untuk
menganalisa kata-kata dan
menerjemahkan
|