Home Start Back Next End
  
19
diproses
lebih
lanjut dalam
fase Cluster
Label Induction
untuk
mendapatkan
label
yang
sebenarnya.
Ada beberapa tahap dalam melakukan Cluster Label Induction:
-
penemuan konsep abstrak.
-
pencocokan frase dan pelabelan.
Penemuan
konsep
abstrak
dilakukan
dengan
metode
Singular 
Value
Decomposition (SVD). SVD dari term document matrix
A
dituliskan sebagai
A
U
V
T
,
di
mana  U  
merupakan
t
t
matriks
ortogonal
di
mana
kolom–kolomnya
berperan
sebagai
vektor
singular
kiri
dari 
A
,
merupakan
d
d
matriks
ortogonal
di
mana
kolom–kolomnya
berperan
sebagai
vektor
singular
kanan
dari 
A
dan 
 
merupakan
t
d
matriks
diagonal
yang
memiliki
nilai
singular
1
2  
...
min ( t , d )
.
Matriks
yang
merupakan
salah
satu
hasil
dari
SVD
merepresentasikan
konsep
abstrak
yang
terdapat pada suatu dokumen. Peringkat dari
matriks  A
(
r
A
)
sama dengan
jumlah dari
nilai singular yang bukan nol.
Hanya
sejumlah  k  pertama
dari
vektor
pada
matriks
digunakan
dalam
fase
lebih
lanjut. Nilai dari
k
ditentukan dari estimasi, dengan bantuan Frobenius
norms dari
matriks  A .
q
merupakan batas
ambang kandidat
label. Semakin besar
nilai
q
,
semakin
banyak
jumlah
kandidat
label
yang
akan
terbentuk.
Setelah
tahap
perhitungan
SVD
matriks 
A
,
kemudian
lakukan
perhitungan
nilai  k 
minimum
yang
memenuhi
kondisi
berikut
A
k
F  
q , 
di 
mana
A
F
X
merupakan 
simbol 
dari 
Frobenius 
norm  dari
F
matriks
X
dengan rumus:
Word to PDF Converter | Word to HTML Converter