Home Start Back Next End
  
32
Tiga kolom terakhir di atas adalah perhitungan bobot dari semua term yang ada.
Berikut adalah penjelasan mengenai kolom – kolom di atas:
-
Kolom 1 –
6: Pertama kita menganalisis indeks
dari term
dari dokumen dan
menentukan jumlah tf
i
untuk query dan setiap dokumen D
j.
-
Kolom 7 – 9: Lalu hitung frekuensi dokumen D
j
untuk setiap dokumen.
-
Kolom 10 -
12: Kita akan menghitung tf * IDF dan menghitung bobot
dari
masing – masing term.
Setelah melakukan perhitungan seperti diatas, selanjutnya akan dilakukan
perhitungan similarity
analysis. Terdapat beberapa metode perhitungan similarity
pada vector
space
model, antara lain: cosine, dot
product, Jaccard
coefficient
dan
Euclidean
distance. Metode yang dipakai pada penelitian kali ini adalah metode
cosine.
Langkah - langkah perhitungan similarity dengan metode cosine adalah :
1.
Hitung panjang vektor untuk setiap dokumen dan query
(abaikan term
dengan
nilai 0)
Of
0
1
1
1
3
3/3=1
0
0
0
0
0
Silver
1
0
2
0
1
3/1=3
0.4771
0.4771
0
0.9542
0
Shipment
0
1
0
1
2
3/2=1.5
0.1761
0
0.1761
0
0.1761
Truck
1
0
1
1
2
3/2=1.5
0.1761
0.1761
0
0.1761
0.1761
Word to PDF Converter | Word to HTML Converter