Home Start Back Next End
  
39
Dengan kata lain dokumen
seharusnya berada di posisi yang lebih tinggi
daripada dokumen
.
Jika menggunakan metode vector space model, hal tersebut tidak dapat
dilakukan, tetapi dengan menggunakan LSI, hal tersebut mungkin dilakukan. Pada
contoh diatas LSI bisa mengetahui bahwa term dagger
sebenarnya berhubungan
dengan dokumen
karena term dagger
muncul bersamaan bersama term pada
dokumen
, yaitu pada dokumen
dan dokumen
. Term dies juga berhubungan
dengan dokumen
dan dokumen
karena muncul bersamaan dengan term
Romeo
pada dokumen
di dalam dokumen
dan term
New-Hampshire
pada
dokumen
di dalam dokumen
. Dari hubungan antar dokumen di atas, LSI
menyimpulkan bahwa dokumen
lebih berhubungan dengan query
daripada
dokumen
karena dokumen
mempunyai
hubungan dengan term dagger
melalui Romeo dan Juliet dan juga mempunyai hubungan dengan term die
melalui
term Romeo, sementara dokumen
hanya mempunyai satu hubungan dengan term
die melalui term New-Hamspire.
Pada LSI, proses pengindeksannya menggunakan Singular Value
Decomposition (SVD) yang berguna untuk menemukan struktur semantik.
Pada LSI, terjadi dua proses utama, yaitu preprocessing dan proses pencarian.
1.
The Preprocessing
Pada tahap preprocessing, ruang term-dokumen
dari document collection
dibuat, biasanya proses ini selesai pada saat pertama kali dijalankan, atau pada saat
terjadi perubahan pada corpus (subjek yang independent) atau pada saat document
Word to PDF Converter | Word to HTML Converter