35
itu, untuk
stemming
sebuah
kata
asal
dalam
bahasa
Indonesia
untuk
memperoleh kata dasarnya, perlu diperhatikan awalan dan akhiran
pada kata asal tersebut.
2.4.4.1 Nazief dan Adriani's Algorithm
Algoritma
Nazief
dan Adriani
berdasar
pada
aturan
morphology
komprehensif
yang mengelompokan
dan
mengenkapsulasi
imbuhan
yang
diperbolehkan
dan
yang
tidak
diperbolehkan,
termasuk
awalan,
akhiran,
sisipan
dan
imbuhan
gabungan.
Algoritma
ini juga
mendukung
pengkodean
ulang
sebuah
pendekatan
untuk
mengembalikan
sebuah
huruf awal
yang
telah
dibuang sebelumnya
dari kata dasar
untuk
menunda
terlebih
dahulu
sebuah
awalan.
Pada
algoritma
ini juga
digunakan
kamus
kata-kata
dasar untuk
memeriksa
jika
stemming
sudah
mencapai
kata dasar.
Pernyataan
tersebut
berdasar
pada
penelitian
Asian,
William,
dan
Tahaghoghi
(2005, pp2-3)
Ada
tiga
komponen
dasar
dalam
algoritma
Nazief
dan
Adriani,
yaitu:
1. Pengelompokan
Imbuhan
Pada
pengelompokan
imbuhan
dibentuk
menjadi
kategori berikut:
a. Inflection Suffix
Kumpulan akhiran yang tidak mengubah kata dasar.
Inflection Suffix dibagi lagi menjadi:
|