![]() 19
diproses
lebih
lanjut dalam
fase Cluster
Label Induction
untuk
mendapatkan
label
yang
sebenarnya.
Ada beberapa tahap dalam melakukan Cluster Label Induction:
-
penemuan konsep abstrak.
-
pencocokan frase dan pelabelan.
Penemuan
konsep
abstrak
dilakukan
dengan
metode
Singular
Value
Decomposition (SVD). SVD dari term document matrix
A
dituliskan sebagai
A
U
V
T
,
di
mana U
merupakan
t
t
matriks
ortogonal
di
mana
kolomkolomnya
berperan
sebagai
vektor
singular
kiri
dari
A
,
V
merupakan
d
d
matriks
ortogonal
di
mana
kolomkolomnya
berperan
sebagai
vektor
singular
kanan
dari
A
dan
merupakan
t
d
matriks
diagonal
yang
memiliki
nilai
singular
1
2
...
min ( t , d )
.
Matriks
U
yang
merupakan
salah
satu
hasil
dari
SVD
merepresentasikan
konsep
abstrak
yang
terdapat pada suatu dokumen. Peringkat dari
matriks A
(
r
A
)
sama dengan
jumlah dari
nilai singular yang bukan nol.
Hanya
sejumlah k pertama
dari
vektor
pada
matriks
U
digunakan
dalam
fase
lebih
lanjut. Nilai dari
k
ditentukan dari estimasi, dengan bantuan Frobenius
norms dari
matriks A .
q
merupakan batas
ambang kandidat
label. Semakin besar
nilai
q
,
semakin
banyak
jumlah
kandidat
label
yang
akan
terbentuk.
Setelah
tahap
perhitungan
SVD
matriks
A
,
kemudian
lakukan
perhitungan
nilai k
minimum
yang
memenuhi
kondisi
berikut
A
k
F
q ,
di
mana
A
F
X
merupakan
simbol
dari
Frobenius
norm dari
F
matriks
X
dengan rumus:
|