2012100544mtif2 - page 8 of 21

Page 8 of 21

Home Start Back Next End

2.4

Optical Character Recognition

(OCR)

Manusia mengenali objek-objek yang ada di sekelilingnya, dengan cara ini mata

menerapkan mekanisme optik. Namun sementara otak melihat input, kemampuan untuk

memahami

sinyal-sinyal

ini

bervariasi

pada

setiap

orang

sesuai

dengan

banyak

faktor.

Begitu halnya dengan OCR (Optical Character Recognition). Teknologi ini

memungkinkan mesin untuk secara otomatis mengenali karakter melalui mekanisme

optik. (AIM.Inc, 2000)

AIM. Inc dalam artikel berjudul Optical Character

Recognition pada tahun 2000

juga

menjelaskan,

OCR

banyak

digunakan untuk

mengkonversi buku-buku

dan dokumen

dalam

bentuk file

elektronik,

misalnya

dalam

bentuk

PDF

dan

lain

sebagainya,

untuk

mengkomputerisasi sistem pencatatan

misalnya di kantor,

atau

untuk

mempublikasikan teks pada website.

OCR

memungkinkan untuk mengedit teks,

mencari

kata

atau

frase,

dan

menerapkan teknik

seperti mesin

penerjemahan,

text-to-speech

dan

text

mining.

OCR

biasa digunakan untuk bidang penelitian dalam pengenalan pola, kecerdasan buatan

(artificial intelligent) dan computer vision.

Sistem OCR memerlukan kalibrasi untuk membaca font yang spesifik, versi awal

harus

diprogram

dengan

gambar

karakter

masing-masing,

dan

bekerja

pada

satu

font

pada suatu waktu. Sistem cerdas (intelligent system) dengan

tingkat akurasi

yang

tinggi

pengakuan

untuk

font

yang

paling

sekarang

umum.

Beberapa

sistem mampu

mereproduksi output diformat yang erat mendekati halaman yang dipindai asli termasuk

gambar, kolom dan non-tekstual komponen. (Nelson, 2007)