29
Algoritma Nazief dan Adriani
Berdasarkan p enelitian
Asian,
William, dan
Tahagho gh i (2005,
pp 2-3),
disebutkan
bahwa
algoritma
Nazief
dan
Adrian i
didasarkan
p
ada
aturan
morfologi komp rehensif
y
ang
men gelo mp okkan dan
men genkap sulasi
imbuhan
y
an g
dip erbolehkan
dan
y
ang tidak
dip erbolehkan,
termasuk
awalan,
akh iran,
sisip an,
dan
imbuhan
gabun g.
Algoritma
ini
ju ga
mendukun g p en gkodean
u
lan g,
sebuah p endekatan
untuk mengembalikan
sebuah
huruf awal
y
ang
telah
dibuan g
sebelu mny a
dari
kata
dasar
untuk
menunda terlebih
dahulu
sebuah
awalan.
Sebagai
tambahan, p ada algoritma ini
ju ga
digunak an kamus
kata-kata dasar
untuk
memer iksa jik a stemming sudah men cap ai kata dasar.
Ada
tiga
komp onen
dasar
dalam algor itma
Nazief
d
an
Adrian i,
y
aitu:
p
engelo mp okkan
imbuhan,
p
enggunaan
aturan
(serta
p
engecualianny a), dan sebuah k amus.
Pengelomp okkan imbuhan d ibentuk menjadi kategori b erikut:
a.
Inflection Suffix
Kump ulan
akhiran
y
ang
tidak
men gubah
kata
d
asar.
Inflection
suffix
dibagi lagi menjad i:
-
Particle (P): -lah, -k ah. M isalny a p ada kata duduklah.
-
Possesive
Pronoun
(PP):
-ku,
-mu,
-ny a.
M
isalny a p ada
kata
ibuny a.
P dan
PP dap at muncul
bersama,
di
man a
PP muncu l
sebelum
P.
Sebuah
k
ata
dap at
memiliki
lebih
d
ari
satu
P
maup un
PP,
dan
dap at
|