Home Start Back Next End
  
18
melekat dari tiap-tiap karakter atau disebut juga dengan fitur dari sebuah objek yang
terdapat
dalam citra.
Karakteristik
ini
digunakan
dalam
mendeskripsikan
sebuah
objek
atau atribut dari sebuah obyek, kemudian
fitur yang dimiliki oleh karakter dapat
digunakan sebagai proses recognition.
Setelah langkah-langkah di atas selesai
dilakukan,
maka
OCR
siap
untuk
melakukan  tahap  pengenalan  dan  akan  memberikan  output  atau  hasil  pengenalan
karakter angka maupun huruf.
Saat
ini
banyak
sekali
OCR
yang
ada,
salah
satunya
adalah tesseract
ocr
yang
akan dibahas selanjutnya.
2.5       Tesseract OCR
Tesseract
adalah engine
open
source OCR
yang
awalnya
dikembangkan
HP
(Hewlett-Packard)
antara
tahun
1984
dan
1994. Tesseract
dimulai
dari
sebuah
proyek
penelitian PhD di HP Laboratorium, Bristol oleh Ray Smith. Setelah penelitian bersama
antara HP Labs Bristol dan Scanner HP divisi di
Colorado,
tesseract
secara signifikan
memimpin dalam akurasi atas mesin komersial tetapi tidak menjadi produk. (Ray Smith,
2005, p1)
Tahap
perkembangan
berikutnya
kembali
di HP
Lab
Bristol
sebagai
investigasi
OCR
untuk
kompresi.
Pada
akhir
proyek
ini, pada
tahun
1994,
pengembangan
berhenti
sepenuhnya.
Mesin
ini
dikirim
ke
UNLV
(University
Nevada
Las
Vegas)
pada
tahun
1995 menjalani tes akurasi tahunan OCR. (Ray Smith, 2005)
Word to PDF Converter | Word to HTML Converter