18
Stemming teks berbahasa Indonesia memiliki beber ap a masalah y ang san gat khusus
terhadap
bahasa. Salah
satu masalah tersebut
adalah p erbedaan
tip e dari
imbuhan-
imbuhan
(affixes),
y
ang
lain
adalah
bahwa
awalan
(prefixes)
dap at
berubah
tergantung
dari huruf p ertama p ada kata dasar.
Sebagai contoh me- dap at berubah
men jadi
mem-
ketika
huruf p ertama
dari
kata
dasar
tersebut
adalah
b,
misalny a
membuat
(to
make), tetap i
me- ju ga d ap at
berubah
menjadi meny - ketika
huruf p ertama dari kata
dasar
melekat
adalah
s,
misalny a meny ap u (to sweep). Selanjutny a ketika ada
lebih
dari
satu
imbuhan
(affixes) y ang
melekat p ada
suatu
kata,
maka
urutan
untuk
men ghilan gkan
imbuhan- imbuhan
(a ffixes)
p
ada
kata
tersebut
menjadi
san gat
p
enting.
Jika dalam p roses
meghilan gkan
imbuhan-imbuhan (affixes) tersebut
kita
tidak
memp erhatikan
urutan p enghilan gan
imbuhan- imbuhan (a ffixes) tersebut, maka kata
dasar
y
ang benar dari kata tersebut tidak akan ditemukan. Seb agai contoh p ada kata
di-
beri-kan (to be given) y ang
diturunkan dari kata dasar
beri (to give). Jika kita
men ghilan gkan akh iran (suffixes)
kan
terlebih
dahu lu sebelum men ghilan gkan awalan
(prefix)
di-
maka
p
ada
p
roses
stemming
ini
kita
mendap atkan
kata
dasar
y
ang benar
y
aitu beri (to give), ak an tetap i jika algoritma stemming mencoba untuk men ghilan gkan
awalan (prefixes) terlebih
dahu lu sebelu m akh iran (suffixes)
maka h asil kata d asar
y
ang
dihasilkan
dari
p
roses
stemming dengan
men ggunakan
algoritma
tersebut
adalah
ik an
(fish)
(setelah
men ghilan gkan
awalan
di
dan
ber)
dimana
ik an
merup akan
kata
dasar
y
ang valid
y
an g terdap at
dalam k amus
tetap i
ikan buk an
merup akan kata dasar
y
ang benar untuk kata turunan diberik an.
|