|
29
hasilnya berupa phrase
matrix
yang terdiri atas baris sebagai deskripsi kata dan kolom
sebagai deskripsi frase.
Dalam tahap pembentukan
matriks, akan diperoleh dua buah
matriks,
yaitu
term
document matrix
yang
mendeskripsikan
seluruh
dokumen
yang
dimiliki,
dan
phrase
matrix yang mendeskripsikan frase yang diinput pada kotak pencarian.
Jika
matriks
yang
mewakili
seluruh dokumen dan seluruh
frase telah
terbentuk,
maka
selanjutnya
akan
dilakukan
proses
yang
secara
garis
besar
dapat
digambarkan
dengan
mengalikan
term
document
matrix
dengan
phrase matrix,
di
mana
akan
dihasilkan sebuah
matriks
yang
menggambarkan kekerabatan antara sejumlah
frase dan
dokumen.
Dari
matriks
ini
dapat
terlihat,
ke
dalam
kelompok
frase
mana
dokumen X
terkategori (terjadi pengelompokan dokumen
ke dalam
kelompok frase yang paling
sesuai). Terlihat pula skor yang didapat untuk tiap dokumen, sebagai contoh:
-
skor dokumen
D1
untuk kelompok
K1 yaitu 0.12,
-
skor dokumen
D1
untuk kelompok
K
2
yaitu 0.5,
maka
dokumen
D1
akan
menjadi
bagian
dalam
kelompok
K
2
karena
memiliki
skor
kekerabatan
dengan
kelompok
K
2
lebih
tinggi
daripada
dengan
kelompok
K1
(skor
kekerabatan dokumen
D1
dengan kelompok
K
2
adalah 0.5).
Skor suatu dokumen akan diperbandingkan dengan skor dokumen lain pada
kelompok
yang
sama,
misalkan
dokumendokumen
yang
tergabung
dalam
kelompok
K
2
terdiri atas:
-
dokumen
D1 dengan skor 0.4,
-
dokumen
D2
dengan skor 0.3,
-
dokumen
D3
dengan skor 0.2,
|