64
4. Clustering
Clustering ialah teknik yang sering digunakan untuk mengelompokkan dokumen-
dokumen
yang
memiliki
kemiripan
tertentu,
namun
berbeda
dari categorization,
clustering
tidak
menentukan
topik
sebelum melakukan
proses.
Keuntungan
teknik
clustering
bahwa
dokumen-dokumen
tersebut
dapat
dimunculkan
dalam beberapa
subtopik. Hal ini memastikan bahwa sebuah dokumen yang berharga tidak akan
dihilangkan dari hasil pencarian. Algoritma dasar Clustering
menciptakan
vektor
dari
topik
untuk
setiap
dokumen
dan
mengukur
berat dari
seberapa
baik
dokumen
itu
cocok
untuk setiap cluster.
5. Concept Linkage
Teknik
concept
linkage menghubungkan dokumen-dokumen yang berhubungan dengan
cara
mengidentifikasi
kemiripan
mereka
dan
membantu
user
untuk
menemukan
informasi
yang
mereka
tidak
dapatkan
ketika mereka
menggunakan
metode
pencarian
tradisional. Metode ini memungkinkan penjelajahan informasi dibandingkan pencarian
informasi.
Concept
linkage
adalah
konsep
yang
berharga
di
dalam
text
mining,
khususnya
dalam aspek
biomedical
dimana
begitu
banyak
riset
yang
telah
dilakukan
sehingga tidak mungkin jika si peneliti harus membaca seluruh materi dan
menghubungkan materi-materi tersebut dengan risetnya yang lain.
|