Home Start Back Next End
  
17
dalam
memenuhi
kebutuhan
seoran g p en gguna
di
d
alam
men cari
informasi.
Kata-kata
tersebut (misalny a a, an, the on p ada Bahasa Inggr is) disebut sebagai Stopwords.
Sebuah
sistem
Text
Retrieval
biasany a
disertai
den gan
sebuah
Stop listStop list
berisi sekump ulan
kata
y
ang 'tidak r elev an',
n
amun
ser in g sekali
muncul
dalam
sebuah
dokumen teks.
Stopwords
removal
adalah
sebuah
p
roses
untuk
men ghilan gkan
kata
y
ang
'tidak
relevan' 
p
ada  hasil  parsing
sebuah  dokumen 
teks 
dengan 
car a 
membandin gk anny a
dengan stopword dan stoplist y ang ada.
2.2.1.2
Stemming
M
enurut
Talla
(2003,
p
7),
Stemming
merup akan
suatu
p
roses
untuk
menemukan
kata dasar dari sebuah k ata.
Dengan
men ghilan gkan semu a
imbuh an (affixes) baik
y
ang
terdiri dari awalan (prefixes), sisip an (infixes), akhiran (suffixes) d an confixes (komb inasi
dari
awalan  dan  akhiran)  p ada
kata
turunan.
S
temming  digun akan
untuk
men gganti
bentuk dari
suatu kata
menjadi kata dasar dari kata tersebut
y
ang
sesuai dengan
struktur
morfolo gi Bah asa Indonesia y an g baik d an benar.
Imbuhan (affixes) p ada Bahasa Indonesia lebih ko mp leks bila
diband in gkan d en gan
imbuhan
(affixes)  p ada
Bahasa
In ggris.
Karena
sep erti
y
ang
telah
disebutkan
di
atas
bahwa
imbuhan
(affixes)
p
ada
Bahasa
Indonesia
terdir i
dari
awalan
(prefixes),
sisip an
(infixes),
akhiran
(suffixes),
bentuk
p
erulangan
(repeated forms)
dan
confixes
(kombinasi
dari 
awalan 
dan 
akhiran). 
Imbuh an-imbuh an 
y
ang 
melek at 
p
ada 
suatu 
kata 
harus
dihilan gk an untuk men gubah bentuk kata tersebut menjadi b entuk kata dasarny a.
Word to PDF Converter | Word to HTML Converter