14
Berdasarkan
defin isi
di
atas,
dap at
disimp ulkan
bahwa
text
categorization
adalah
sebuah p roses untuk mengkategorisasi sebu ah dokumen teks sesuai den gan kategori
y
ang
telah ditentukan y ang bertujuan untuk memp ermudah d alam men gor ganisir dokumen teks
dalam jumlah besar.
2.1.2
Retrival Dokumen Teks
Retrival
dokumen
teks
adalah
sebuah
cab an g dari
retrival
infor masi
dimana
informasi y an g disimp an
ad alah
berup a teks. Sistem
retrival dokumen teks
menemukan
informasi dari kriteria y ang diberikan
den gan
menco cokkan kueri
y
ang dimasukkan oleh
p
enggun a
akhir
den gan
dokumen-doku men
teks
y
ang
telah
tersimp an.
Sebuah
sistem
retrival
dokumen
teks
terdiri
dari
koleksi
dokumen
teks,
sebuah
algoritma
klasif ikasi
untuk
memban gun
indeks, dan
sebu ah antarmuka p enggun a
untuk
men ghubun gkan
dengan koleksi.
Sebuah sistem retrival dokumen teks memiliki dua tu gas utama, y aitu :
1.
M
enemukan dokumen teks y ang relev an sesuai den gan kueri y an g dimasukkan.
2.
M
engevaluasi dokumen
teks y ang
cocok
dan
men gurutkan
sesuai
den gan
relevansiny a den gan
men ggunak an algor itma tertentu.
M
enurut
Ricardo Baeza- Yates (1999,p 10), p roses dari retrival infor masi teks adalah
sebagai ber ikut
:
|