![]() 25
0
0.5600
1.0000
0
0
0
0
0.7100
0
0
1.0000
0
0
0
P
0.7100
0
0
0
1.0000
0
0
0
0
0
0
0
1.0000
0
0
demikian, elemen
C
i
j
dari matriks
C
mengindikasikan kekuatan hubungan antara
dokumen
ke
j
dan
kelompok
ke- i .
Dokumen
ditambahkan
ke
dalam
kelompok
jika
C
i
j
termasuk dalam batas ambang yang ditetapkan. Dokumen yang tidak ditandai
kepada kelompok
tertentu, akan dimasukkan ke dalam kelompok
yang dinamakan
Others. Berikut algoritma Cluster Content Discovery:
Untuk setiap
L
kandidat label kelompok lakukan langkah langkah berikut
{
Buat kelompok
C
dengan
L
sebagai deskripsi;
Tambahkan ke dalam
C
semua dokumen yang skor kemiripannya
dengan
C
masuk dalam batas ambang;
}
Masukkan
ke
dalam kelompok
Others
setiap
dokumen
yang
belum
menjadi
anggota dari kelompok manapun kelompok manapun;
Contoh kasus lanjutan:
Pada
akhirnya,
dokumen
ditandai
pada
kelompok
dengan
mengaplikasikan
matriks Q
dengan
A
TFIDF
.
Dari tahap sebelumnya diketahui:
0.8300
0
0
0
0
1.0000
|