Home Start Back Next End
  
17
4.
Stemming dan Lemmatisasi
Sebuah kata kerja dalam dokumen sering kali memiliki banyak bentuk atau tata
bahasa yang berbeda, untuk mengatasinya dilakukan stemming dan lemmatisasi.
Tujuan akhir dari stemming maupun lemmatisasi merupakan proses mereduksi kata
menjadi kata dasar, proses ini
dilakukan  dengan pemotongan akhiran dan awalan
kata. Dengan cara ini, diperoleh kelompok kata yang mempunyai makna serupa
tetapi berbeda wujud sintaktis satu dengan lainnya. Kelompok tersebut dapat
direpresentasikan oleh satu kata tertentu.  Meskipun demikian stemming dan
lemmatisasi memiliki perbedaan dalam cara kerjanya. Stemming melakukan proses
pemotongan akhiran dan awalan untuk mencapai tujuan tersebut, sedangkan
lemmatisasi melihat penggunaan kata kerja serta analisis morfologi terlebih dahulu
sebelum melakukan pemotongan, hasil dari lemmatisasi biasa disebut dengan
lemma. Misalkan sebuah kata saw, stemming hanya akan mengembalikan kata see,
sedangkan lemmatisasi akan memotongnya ke bentuk see atau saw tergantung pada
penggunaan katanya sebagai verb
atau noun. Meskipun lemmatisasi membantu
meningkatkan precision
untuk sebagian besar query
namun lemmatisasi akan
menurunkan performa karena membutuhkan proses yang cukup besar. Stemming
akan meningkatkan recall dan menurunkan precision.
2.2.1.3  Indexing
Proses
indexing adalah proses yang merepresentasikan document collection ke
dalam bentuk tertentu untuk memudahkan dan mempercepat proses pencarian
dokumen yang relevan.
Word to PDF Converter | Word to HTML Converter