![]() 28
jumlah term atau seberapa sering term i muncul di dalam sebuah dokumen.
jumlah dokumen yang mengandung term i
jumlah dokumen secara kesuluruhan
Pada persamaan diatas, nilai rasio dari
adalah besarnya peluang terpilihnya
dokumen yang mengandung term-query. Lalu
adalah frekuensi dari
inverse dokumen,
dan merupakan informasi global dan
adalah informasi lokal
Untuk lebih jelasnya mengenai hubungan antara informasi global dan informasi
lokal, berikut akan disediakan contohnya:
Berikut adalah kumpulan dokumen yang terdiri dari lima dokumen, D1, D2,
D3, D4, dan D5. Dari semua dokumen yang ada, hanya ada tiga dokumen yang
mengandung term CAR, yaitu dokumen D1, D2, dan D3, sehingga nilai dari IDF
untuk term ini adalah
= 0.2218
Gambar 2.8 Diagram Dokumen TF-IDF
|