55
untuk
melengkapi
kalimat
di
atas
adalah apel, hal ini didasarkan atas
pengamatan
kita
terhadap
kata
yang
(sesuai
dengan
representasi bigram)
menyertai kata apel, secara
matematis pengamatan kontekstual tersebut dapat
dituliskan sebagai berikut: P( kata
(x)
| kata
(x-1)
)
Tabel B
Merupakan
contoh
perhitungan
distribusi
bigram
untuk
kata
ujang
pergi
membeli apel, perhitungan
ini dilakukan dengan
menghitung distribusi
setiap kata mengingat runutan kata ini dengan satu kata sebelumnya
Tabel C
Merupakan
contoh
perhitungan
distribusi
unigram
untuk
setiap
kata
yang
menjadi pengamatan tabel B, perhitungan ini dilakukan dengan menghitung
distribusi setiap kata tanpa
mengingat adanya
hubungannya dengan kata
lain
yang menyertainya.
Tabel D
Merupakan
contoh
perhitungan
probabilitas
bigram
untuk
setiap
kata,
perhitungan
ini
dilakukan
dengan
membagi
distribusi
bigram setiap
kata
dengan
distribusi unigram atas
kata
yang
berkesuaian
atau
secara
matematis
ditulis: B(ujang,ujang) / C(ujang).
Menurut Daniel Jurafsky dan James H. Martin (2006, p1), seperti dalam
kebanyakan
model statistika, N-Gram sangat bergantung pada datadata yang digunakan
sebagai
model
pengamatan
oleh
karena
itu
kinerja
N-Gram
akan
semakin
membaik
ketika
nilai
dari
N
ditingkatkan,
berikut
adalah
contoh
yang
diambil
dari
salah
satu
|