27
2.2.3 Tahap Kategorisasi
dan Retrival Dokumen Teks
Tahap
terakhir
adalah
tahap
p
engujian
kategorisasi
y
an g akan
memb erikan
k
elas
p
ada data testing dengan
men ggun akan
model y ang telah
dib an gun p ada tahap
training
dan retrival
den gan
men gambil d ata relevan terhad ap kueri y ang dimasukkan. Proses in i
dilakukan
d
en gan
men ggunakan
metode
classifier
y
ang telah
ditentukan.
Tujuan
dilakukan testing ad alah
untuk
men getahui p erformansi dar i
model y an g telah dibentuk
dengan
men ggun akan
seku mp ulan
data
test.
Den gan
b
eberap a
p
arameter
p
engukur an
untuk mengetahui k eakuratanny a y aitu precision dan recall.
2.2.3.1
Evaluasi
Salah
satu
p
enerap an
p
rinsip
relevansi
y
ang sejak
dahulu
digunak an
dalam
p
engemban gan sistem retrival infor masi
ad alah p en ggunaan
ukur an
recall and precis ion.
Sejak
teori
tentang r etrival
infor masi
b
erkemb an g di
tahun
1940an,
p
ara
ilmuan
selalu
memer as
otak,
bagaiman a
carany a
membuat
sistem
retrival
informasi
y
ang b enar-ben ar
handal.
Reca ll
and
precision adalah
up ay a
untuk
men gukur keef ektifan
sebuah
sistem
retrival
infor masi
d
alam
memenuhi
p
ermintaan informasi
dan
men gukur
kemamp uan
sistem dalam meny ediakan dokumen y ang relevan d en gan kebutuhan p emakai.
Terjemahan
y
ang p as
untuk
istilah
ini
dalam
Bahasa
Indonesia
belum
d
itemukan.
Istilah
recall d igunakan
p
ula dalam p sikologi untuk
menjelaskan p roses
men gin gat
y
ang
dikerjak an otak
manusia. Kata
lain
untuk
recall dalam
Bahasa
In ggr is
adalah
remember,
recollect, remind. Di b idan g IR, reca ll berk aitan den gan k emamp uan menemukan-kembali
|