17
dalam
memenuhi
kebutuhan
seoran g p en gguna
di
d
alam
men cari
informasi.
Kata-kata
tersebut (misalny a a, an, the on p ada Bahasa Inggr is) disebut sebagai Stopwords.
Sebuah
sistem
Text
Retrieval
biasany a
disertai
den gan
sebuah
Stop list. Stop list
berisi sekump ulan
kata
y
ang 'tidak r elev an',
n
amun
ser in g sekali
muncul
dalam
sebuah
dokumen teks.
Stopwords
removal
adalah
sebuah
p
roses
untuk
men ghilan gkan
kata
y
ang
'tidak
relevan'
p
ada hasil parsing
sebuah dokumen
teks
dengan
car a
membandin gk anny a
dengan stopword dan stoplist y ang ada.
2.2.1.2
Stemming
M
enurut
Talla
(2003,
p
7),
Stemming
merup akan
suatu
p
roses
untuk
menemukan
kata dasar dari sebuah k ata.
Dengan
men ghilan gkan semu a
imbuh an (affixes) baik
y
ang
terdiri dari awalan (prefixes), sisip an (infixes), akhiran (suffixes) d an confixes (komb inasi
dari
awalan dan akhiran) p ada
kata
turunan.
S
temming digun akan
untuk
men gganti
bentuk dari
suatu kata
menjadi kata dasar dari kata tersebut
y
ang
sesuai dengan
struktur
morfolo gi Bah asa Indonesia y an g baik d an benar.
Imbuhan (affixes) p ada Bahasa Indonesia lebih ko mp leks bila
diband in gkan d en gan
imbuhan
(affixes) p ada
Bahasa
In ggris.
Karena
sep erti
y
ang
telah
disebutkan
di
atas
bahwa
imbuhan
(affixes)
p
ada
Bahasa
Indonesia
terdir i
dari
awalan
(prefixes),
sisip an
(infixes),
akhiran
(suffixes),
bentuk
p
erulangan
(repeated forms)
dan
confixes
(kombinasi
dari
awalan
dan
akhiran).
Imbuh an-imbuh an
y
ang
melek at
p
ada
suatu
kata
harus
dihilan gk an untuk men gubah bentuk kata tersebut menjadi b entuk kata dasarny a.
|