Home Start Back Next End
  
12
-
semi–structured
(dokumen yang memiliki struktur tree, misalnya
dokumen XML) biasanya memberikan tag tertentu pada termterm
pada dokumen, sedangkan pada dokumen.
-
unstructured
(dokumen yang tidak memiliki pola, misalnya artikel
atau paragraf) proses ini akan dilewati dan term pada dokumen akan
dibiarkan tanpa imbuhan tag.
Operasi dasar yang akan dilakukan terhadap text pada isi dokumen.
Sistem akan membentuk indeks dari text. 
Indeks
merupakan bagian yang sangat kritikal karena akan berpengaruh pada
proses pencarian yang cepat dalam volume data yang sangat besar. Struktur
indeks
dapat
berbeda-beda,
namun yang paling popular untuk
digunakan
adalah
inverted index. (Modern Information Retrieval:2010). Pembuatan
indeks
akan
melibatkan DB Manager Module untuk
mengambil data-data
indeks yang telah disimpan pada text database sebelumnya.
indeks
tersebut akan disimpan ke dalam text database melalui
DB Manager
Module.
2.
Ketika
document text database
selesai dibentuk, maka user
sudah
dapat
melakukan
pencarian. Untuk melakukan pencarian, langkah –
langkah yang
harus dilakukan adalah sebagai berikut :
Pada
suatu
kebutuhan
pencarian data atau
kebutuhan
informasi
pengguna
akan merepresentasikan kebutuhan tersebut dengan menggunakan query.
Query Operation akan dilakukan setelah user menginput query.
Word to PDF Converter | Word to HTML Converter