43
Langkah terakhir dari proses line creation
adalah menggabungkan blob
yang overlapping, menempatkan diacritical marks pada dasar yang tepat, dan
memperbaiki beberapa karakter yang rusak. (Smith, 2009, p2)
2.
Baseline Fitting
Setelah baris teks ditemukan, garis pangkal (baseline) dicocokan dengan
menggunakan quadratic spline. Hal ini merupakan salah satu kelebihan dari
sistem OCR tesseract
yang dapat
menangani halaman dengan garis pangkal
(baseline) yang miring (Smith, 2009, p2)
Baseline dicocokan oleh partisi blob
menjadi beberapa kelompok dengan
sebuah perpindahan kontinu yang hampir mirip
garis pangkal lurus yang asli.
Quadratic spline dicocokan ke partisi yang paling padat (diasumsikan sebagai
baseline) dengan kuadrat terkecil. Keuntungan
Quadratic spline
yaitu
perhitungannya cukup stabil namun
merugikan jika terjadi
diskontinuitas..
Dalam Hal ini, cubic spline bekerja lebih baik (Smith, 2009, p2)
3.
Perkiraan Ketinggian X Pada Teks
Setelah menemukan baris teks dan menyusun blok blob
menjadi baris-
baris, Tesseract mengestimasi ketinggian-x untuk setiap baris teks. Pertama,
algoritma ini menentukan batas maksimum dan minimum dari ketinggian-x yang
dapat diterima berdasarkan ukuran garis inisial yang telah dihitung. Kemudian,
ketinggian bounding box blob pada garis dikuantisasi dan dikumpulkan menjadi
sebuah histogram. Dari histogram ini, algoritma mencari ketinggian dua mode
yang paling sering terjadi dan
terpisah
cukup jauh
untuk menjadi ketinggian-x
dan ketinggian-ascender. Untuk mengantisipasi noise, algoritma memastikan
|