Home Start Back Next End
  
18
Pembuatan index
dari document
collection
adalah tugas pokok pada tahapan
pre-processing di dalam information retrieval. Efektitifitas dan efisiensi information
retrieval
dipengaruhi oleh kualitas indeks-nya. Pengindeksan membedakan
dokumen satu dengan dokumen yang lain yang berada di dalam satu collection.
Indeks dengan ukuran yang kecil dapat memberikan hasil yang kurang baik dan bisa
saja beberapa dokumen yang seharusnya relevan terabaikan. Sementara indeks
dengan ukuran yang
besar memungkinkan ditemukannya
dokumen yang tidak
relevan dan menurunkan kecepatan pencarian. 
Pembuatan inverted
index
harus melibatkan konsep linguistic
processing
yang
bertujuan mengekstrak term-term
penting dari dokumen yang direpresentasikan
sebagai bag-of-words
Gambar 2.3 Proses Esktraksi Term
  Query
Dokumen
Representasi
query
Representasi
dokumen
Proses
pencocokan
Daftar
dokumen
Word to PDF Converter | Word to HTML Converter