![]() 34
input
dan
mencari
spasi
dan tanda
baca
untuk
mengidentifikasi
kata
tunggal.
Pada tahap ini,
kata
input-an
dibagi
ke dalam
unit
yang
lebih
kecil
yang
disebut
morfem. Morfem
merupakan
unit terkecil
dari
bahasa.
Sebuah
morfem
dapat
berupa
kata
itu sendiri,
yang
disebut
dengan
morfem
bebas.
Sebagai
contoh,
kata
keyboard adalah
sebuah morfem. Di sisi lain, keyboards
terdiri dari dua morfem,
kata
dasarnya sendiri
keyboard,
dan huruf s yang ditambahkan
di akhir
kata
yang
mengidetifikasikan jamak.
Huruf
s
merupakan tipe
morfem
yang disebut
bound
morpheme.
Bound
Morpheme
biasanya
merupakan
awalan
dan akhiran
yang
digunakan
pada
kata
dasar
untuk
memodifikasi
arti. (Turban, 1992, p282).
Tidak berbeda jauh dengan pendapat Turban, menurut Rich
dan
Knight
(1991,
p381),
analisis
morfologi
harus
dapat
melakukan
hal berikut:
Memisahkan
kata keyboards
ke dalam kata benda yang
benar keyboard dan akhiran kepunyaan s.
Mengenal
deretan .init sebagai
ekstensi
file
yang
berfungsi
sebagai kata sifat dalam kalimat.
Dalam
menganalisis
struktur
morfologi
dari kata-kata
dalam
n-
bahasa
Indonesia,
diperlukan
suatu algoritma
stemming
yang
sesuai.
Stemming
digunakan
untuk
mengubah
variasi
kata
ke bentuk
kata
dasarnya dengan
mengaplikasikan
aturan-aturan
morfologi.
Tidak
seperti
bahasa
Inggris,
dimana
peran akhiran
mendominasi
pembentukan kata
asal,
bahasa
Indonesia bergantung baik
pada
awalan
maupun
akhiran
untuk
menghasilkan kata-kata
baru.
Karena
|