Home Start Back Next End
  
63
maknanya. Secara umum, ketika manusia menyimpulkan bacaan, kita membaca secara
keseluruhan untuk memahaminya, lalu menuliskan kesimpulannya dengan mengambil
intinya.
Karena
komputer
belum
mempunyai
kapabilitas
bahasa manusia,
metode
alternatif harus dipertimbangkan.
Salah
satu strategi
yang
sering
digunakan
pada text summarization tool
ialah
sentence
extraction,
mengekstrak
kalimat
penting
dari sebuah artikel dengan mengukur
kalimat tersebut secara statistik. Summarization dapat bekerja dengan topic tracking tool
atau categorization tool dalam proses
untuk
merangkum dokumen
yang diinginkan pada
topik-topik
tertentu.
Jika
user
diberikan
ratusan
dokumen
yang
berhubungan
dengan
topic
yang
mereka
inginkan,
maka summarization
tool
dapat
digunakan
untuk
mengurangi waktu pencarian mereka untuk menyortir dokumen-dokumennya.
3.   Categorization
Categorization mengidentifikasi topik utama dari dokumen dengan menempatkan
dokumen
ke
dalam suatu
set
topik
yang
telah
didefinisikan
sebelumnya.
Ketika
mengkategorikan
suatu
dokumen,
program komputer
akan
memperlakukan
dokumen
sebagai
bag
of
words. Categorization
tidak
melakukan
proses
pada
informasi
aktual
seperti pada information extraction lakukan. Categorization
hanya
menghitung kata-kata
yang muncul dan mengidentifikasi topik utama dari judul dokumen. Categorization
biasanya
bergantung
pada
kosakata
pada
topik
yang
telah
ditentukan sebelumnya dan
hubungan didefinisikan dengan mencari broad terms, narrower terms,
sinonim dan
related
terms.
Categorization tool
secara
normal
mempunyai
metode
untuk
membuat
ranking pada dokumen berdasarkan isi yang paling sesuai dengan topik yang ditentukan.
Word to PDF Converter | Word to HTML Converter