![]() 22
i
i
Tahap
terakhir
pada
Cluster
Label
Induction adalah
pencocokan
frase
dan
pelabelan.
Pada
tahap
ini,
konsep
abstrak
dan
frequent
phrase
diekspresikan
dalam
satu
buah ruang vektor di mana deskripsi kelompok dapat diketahui. Untuk selanjutnya dapat
dilakukan perhitungan jarak klasik dengan
menggunakkan kosinus
untuk
mengkalkulasi
seberapa dekat jarak/kekerabatan antara frase dan konsep abstrak.
Misalkan ada sebuah matriks
P dan sejumlah
i
kolom dari matriks U
hasil dari
perhitungan SVD. Vektor
m
i
adalah kosinus sudut antara konsep abstrak yang kei dan
frequent phrase
dapat dikalkulasikan dengan rumus
m
U
T
P
. Frase yang sesuai
dengan komponen
maksimum dari
vektor
m , dipilih sebagai kandidat
i , dipilih sebagai kandidat
label kelompok.
Sedangkan
nilai
kosinusnya
menjadi
skor
bagi
kandidat
label
kelompok.
Berikut
algoritmanya:
P ? matriks frase
P
f
;
Untuk setiap
kolom hasil dari
U
T
P
{
cari
satu
yang maksimum untuk setiap kolom m ;
i ;
tambahkan
frase
yang
bernilai
maksimum
tersebut
ke
dalam
kandidat label;
skorLabel =
}
m ;
i ;
Contoh kasus lanjutan:
Dari tahap sebelumnya didapatkan:
|