Home Start Back Next End
  
62
kunci dan hubungan dalam teks. Ini dilakukan dengan
mencari urutan yang telah
didefinisakan
sebelumnya
di
dalam teks,
sebuah
proses
yang
disebut
pattern
matching.
Software
ini
dapat
menyimpulkan
hubungan di antara objek yang telah terdefinisi
untuk
memberikan user
informasi
yang
bermakna.
Teknologi
ini
sangat
berguna untuk
volume
data
yang
besar.
Hampir
semua
software  text  mining  menggunakainformation  extraction  karena ini merupakan dasar dari
semua teknologi text mining yang ada.
1.   Topic Extraction
Sistem 
Topic 
Extraction 
bekerja 
dengan 
menyimpan 
profil 
user 
dan 
berdasarkan
dokumen
yang
user
lihat,
lalu
memprediksi
dokumen
lain
yang
memiliki
daya
tarik
untuk
user tersebut.
Teknologi Topic Extraction mempunyai keterbatasan pada tingkatan
akurasinya.
Beberapa
text
mining
tool
yang baik
memungkinkan
user
untuk
memilih
kategori
tertentu
atau software
secara
otomatis
dapat
menarik
kesimpulan
dari
ketertarikan
user berdasarkan sejarah bacaan user dan
informasi
yang dicari
user
melalui
penekanan tombol mouse.
2.   Summarization
Text summarization sangat membantu untuk mengetahui apakah sebuah dokumen yang
panjang  termasuk  dalam  kriteria  yang  dibutuhkan  oleh  user  dan  cocok  untuk  terus
dibaca. Kunci dari summarization
ialah
mengurangi panjang dan detail dari dokumen
namun tetap menjaga maksud inti dan keseluruhan. Tantangannya terletak di sana,
walaupun komputer mampu untuk menentukan pelaku,
tempat, dan
waktu,
namun tetap
sulit  untuk  mengajarkan  software untuk 
menganalisa  kata-kata  dan 
menerjemahkan
Word to PDF Converter | Word to HTML Converter