Home Start Back Next End
  
16
TF
n
i
n
k
k
n
i
n
k
k
=
frekuensi munculnya
suatu kata dalam suatu dokumen.
=
banyaknya kata dalam suatu dokumen.
Document
frequency
merupakan pengukuran secara
umum
tingkat
kepentingan
dari
suatu
kata
(log
dari
hasil
perhitungan
jumlah
dokumen
dibagi
dengan
banyaknya
dokumen yang mengandung kata tertentu).
TFIDF
TF
log
|
D
|
|
(
d
t
j
|
Contoh kasus:
5 buah kata yang terdapat dalam keseluruhan dokumen:
T1 : Information
T2 : Singular
T3 : Value
T
4
:
Computations
T
5
:
Retrieval
2 buah frase yang ingin dicari:
P1
:
Singular
Value
P2
:
Information Retrieval
7 buah dokumen yang tersedia:
D1 : Large Scale Singular Value Computations
D2
:
Software for the Sparse Singular Value Decomposition
D3 : Introduction to Modern Information Retrieval
D
4
:
Linear Algebra for Intelligent Information Retrieval
D
5
:
Matrix Computations
Word to PDF Converter | Word to HTML Converter