Home Start Back Next End
  
16
2.4
Optical Character Recognition
(OCR)
Manusia mengenali objek-objek yang ada di sekelilingnya, dengan cara ini mata
menerapkan mekanisme optik. Namun sementara otak melihat input, kemampuan untuk
memahami
sinyal-sinyal
ini
bervariasi
pada
setiap
orang
sesuai
dengan
banyak
faktor.
Begitu halnya dengan OCR (Optical Character Recognition). Teknologi ini
memungkinkan mesin untuk secara otomatis mengenali karakter melalui mekanisme
optik. (AIM.Inc, 2000)
AIM. Inc dalam artikel berjudul Optical Character
Recognition pada tahun 2000
juga    
menjelaskan,    
OCR    
banyak    
digunakan untuk    
mengkonversi buku-buku
dan dokumen
ke
dalam
bentuk file
elektronik,
misalnya
dalam
bentuk
PDF
dan
lain
sebagainya,
untuk
mengkomputerisasi sistem pencatatan
misalnya di kantor, 
atau
untuk
mempublikasikan teks pada website.
OCR
memungkinkan untuk mengedit teks,
mencari
kata 
atau
frase,
dan
menerapkan teknik
seperti mesin
penerjemahan,
text-to-speech
dan
text
mining.
OCR
biasa  digunakan  untuk  bidang  penelitian  dalam pengenalan  pola,  kecerdasan  buatan
(artificial intelligent) dan computer vision.
Sistem OCR memerlukan kalibrasi untuk membaca font yang spesifik, versi awal
harus
diprogram
dengan
gambar
karakter
masing-masing,
dan
bekerja
pada
satu
font
pada suatu waktu. Sistem cerdas (intelligent system) dengan
tingkat akurasi
yang
tinggi
pengakuan
untuk
font
yang
paling
sekarang
umum.
Beberapa
sistem mampu
mereproduksi output diformat yang erat mendekati halaman yang dipindai asli termasuk
gambar, kolom dan non-tekstual komponen. (Nelson, 2007)
Word to PDF Converter | Word to HTML Converter