![]() 23
Gambar 2.6 Kandidat Titik Potong
Gambar 2.6 di atas
menunjukkan satu set calon titik potong (chop points) dengan
tanda panah dan potongan terpilih sebagai sebuah garis melintasi kerangka dimana huruf
r bersentuhan dengan m. (Ray Smith, 2005, p3)
2.5.7
Asosiasi Karakter Patah
Ketika potongan yang potensial tidak ada lagi, ketika kata tersebut masi belum
cukup baik, hal ini diberikan kepada associator. Associator membuat pencarian A* (best
first
search)
dari
segmentasi
grafik
yang
mungkin
kombinasi
dari
blob
yang
dipotong
secara
maksimal
ke
dalam kandidat
karakter.
Ketika
A*
segmentation
digunakan
untuk
diimplementasikan
pertama
kali
pada
tahun
1989,
akurasi tesseract
terhadap
karakter
yang rusak cukup baik yang menjadikan
tesseract mesin komersial pada saat itu. (Ray
Smith, 2005, p3)
Gambar 2.7 Sebuah kata yang rusak bisa dikenali
2.5.8
Klasifikasi Bentuk
2.5.8.1 Static Classifier
Sebuah
versi
awal
dari
tesseract
digunakan
topologi
fitur
yang
dikembangkan
dari karya Shillman. Ide selanjutnya melibatkan penggunaan segmen dari poligonal
|