Home Start Back Next End
  
36
Hasil dari normalisasi bobot di atas kemudian digunakan untuk menghitung
vektor dokumen dan query.
2.3.3
Latent Semantic Indexing (LSI)
LSI adalah metode pengindeksan secara otomatis yang dibuat untuk mengatasi
dua masalah dasar yang kerap ditemui pada pengindeksan tradisional yang memakai
metode pencocokan keyword: synonymy
dan polysemy. Synonymy
adalah keadaan
dimana terdapat beberapa kata berbeda,
tetapi kata -
kata tersebut mempunyai arti
yang sama, sementara polysemy adalah keadaan dimana satu kata mempunyai lebih
dari satu arti. LSI adalah metode pengindeksan hasil pengembangan dari ruang
model vektor. Pada ruang model vektor, dokumen
dan term
dinyatakan sebagai
sebuah vektor, sementara LSI (latent
semantic
indexing) lebih condong
menggunakan matriks untuk me-retrieve dokumen.
Gambar 2.9 Flowchart Training LSI Model
Word to PDF Converter | Word to HTML Converter