|
12
2.4 Pengenalan Karakter dengan Feature Point Extraction
2.4.1 Pengenalan OCR
Menurut
Eric
W. Brown
(
Optical
Character Recognition (OCR) telah menjadi topik yang menarik sejak akhir tahun 1940-
an
ketika
Jacob
Rabinow
memulai
pekerjaannya
dalam bidang
ini.
Mesin
OCR
yang
pertama kali adalah alat mekanik yang sederhana dengan tingkat kesalahan yang cukup
tinggi. Seiring dengan bertambahnya jumlah materi yang tertulis, maka kebutuhan untuk
memproses ini semua dengan cepat dan dapat dihandalkan semakin tinggi. Mesin-mesin
pada waktu itu belum bisa memenuhi kebutuhan ini. Untuk mengatasi masalah ini, maka
ditemukanlah
alat
OCR
yang
berbasiskan komputer yang dapat melebihi kemampuan
mesin-mesin itu dalam hal kecepatan dan kehandalan.
Pada zaman sekarang terdapat banyak alat OCR digunakan berdasarkan
sekumpulan algoritma yang berbeda-beda. Semua algoritma yang popular mendukung
ketepatan
dan
kecepatan yang
tinggi,
tetapi
masih
banyak
mengalami
kekurangan
yang
agak
sederhana
:
ketika
algoritma
tersebut melakukan
kesalahan,
kesalahan
tersebut
sering kali
sangat
tidak alami bagi sudut pandang
manusia. Contohnya,
menganggap
5
sebagai S tidak terlalu mengagetkan karena kebanyakan orang setuju bahwa kedua
karakter
ini
mirip,
tetapi
menganggap
5
sebagai M sangat bertentangan dan tidak
terduga.
Algoritma-algoritma
melakukan
kesalahan seperti itu karena mereka umumnya
beroperasi
pada
kumpulan
fitur
yang
berbeda
daripada
manusia
sebagai
alasan
komputasi. Manusia mengamati coretan dan hubungan antara coretan tersebut,
sementara
algoritma-algoritma
mengukur
segala sesuatu dari transformasi
Ring
Projection suatu karakter ke transformasi Fourier dari Horizontal-Vertical Projections
|