|
16
2.3. Ekstraksi Fitur
Setelah
pengambilan sampel,
sinyal
percakapan
diketahui
masih
relatif
berulang,
sehingga
speech
coders/decoders
(codecs)
didesain
untuk
mengekstraksi
representasi yang kompak
(compact
representation)
yang cukup
untuk
rekonstruksi
dari sinyal dengan kualitas tinggi. Dalam
sistem pengenalan suara, representasi
yang
kompak
ini
juga
diperlukan.
Algoritma
pemprosesan sinyal
digunakan
untuk
mengekstrak
vektor
fitur,
mempertahankan informasi
yang
diperlukan
untuk
mengenali
percakapan dan
membuang
sisanya.
Langkah
ini
sering
disebut
sebagai
Ekstraksi Fitur (Feature Extraction). (Thiran, Marqués and Bourlard 2010, 29). Fitur
dari
sebuah
sistem
pengenalan pola
yang
baik
harus
bersifat
alamiah,
dapat
diukur
dengan
mudah,
tidak
berubah
dari
waktu
ke
waktu
atau
terpengaruh
oleh
kondisi
kesehatan pengguna, tidak
terpengaruh oleh noise,
dan tidak dapat ditiru oleh orang
lain.
Pengenalan suara
pada
dasarnya
bergantung
pada
pengenalan
rangkaian
fenomena
yang
bergantung
pada
bentuk
suara.
Pada
umumnya
pendekatan
umum
untuk
ekstraksi
fitur
adalah
mengekstraksi
representasi
halus
dari
kepadatan
kekuatan
spectrum
sinyal
(karakteristik dari
respon
filter
frekuensi),
biasanya
diperkirakan dari analisis frame
yang sepanjang 20-30
ms.
Beberapa alat
pemprosesan
sinyal
sering
digunakan
pada
implementasi
ekstraksi
fitur.
Alat
tersebut
termasuk
transformasi fourier
waktu
singkat
(short-time
fourier
transform)
yang
dapat
digunakan
untuk
memperoleh
kekuatan
dan
fase
spectrum
dari
analisa
frame
singkat.
Alat
lainnya
yang biasa digunakan adalah Linear
Predictive
Coding
|