51
sekump ulan kata kunci, y ang tadiny a tidak len gkap dan tidak
sesuai,
menjadi sekump ulan
objek y ang berhubun gan.
M
etode retrival y ang
sudah berkembang
sebelumny a tidak
mamp u
menangani
masalah sinonim d an p olisemi. Sinonim adalah kata y an g berbed a namun memiliki makn a
y
ang sama. M isalny a p engguna men ggunkan k ata y ang berbed a untuk mencari ob jek y an g
sama,
sebagai
contoh
kata
car
dan
automobile.
Polisemi
ad alah
kata
y
ang
sama,
namun
memiliki
makna
y
an g berb eda, sebagai contoh kata jaguar
bisa
ber makna
tip e
kendaraan atau nama b inatan g.
Latent
Semantic
Ind exing
(LSI)
adalah
mod el
temu
kembali
y
ang
mamp u
memecahkan
masalah
sinomim.
Den gan
men ggunakan
S
ingular Valu e
Decomposition
(SVD) d an
Eigenvalue
p
ada sebuah
term
den gan
men ggunak an
matriks
bobot
term
dar i
dokumen. Dimensi transformasi ruang
di-reduce den gan
car a memilih
nilai singular
(singular value).
M
etode p enentuan
similarity antara dokumen kueri dan dokumen koleksi p ada LSI
adalah
sama
den gan
M
odel
Ruang
Vektor,
y
aitu
dengan
men ghitun g
nilai
cosinus
dar i
vektor
kueri
dan
vektor
dokumen.
M
etode
LSI
in i
memiliki
b
any ak
kemirip an
den gan
M
odel
Ruang
Vektor,
metode
p
embobotan
dan
p
encarian
similarity
san gatlah
identik,
y
ang
memb edakan
2 metode
in i
adalah
metode
SVD
dalam
p
ereduksian
dimensi
y
an g
digun akan p ada LSI.
|