1
BAB I
PENDAHULUAN
1.1.
LATAR BELAKANG
Regresi
linier
adalah teknik
pemodelan
di mana nilai
variabel dependen
dimodelkan
sebagai kombinasi linier pada sekumpulan
variabel penjelas. Variabel
dependen merupakan variabel yang dijelaskan atau diestimasi oleh variabel penjelas.
Sedangkan variabel penjelas merupakan variabel yang digunakan untuk
mengestimasi variabel dependen. Regresi linier sederhana mengacu pada model
regresi linier untuk satu variabel penjelas. Sedangkan, model regresi linier ganda
merupakan perluasan dari model regresi linier sederhana yang memungkinkan
variabel dependen dimodelkan untuk dua atau lebih variabel penjelas (Hayter, 2012:
543-608).
Dalam pembuatan model regresi linier, tidak tertutup kemungkinan model
awal yang diperoleh masih kurang
optimal. Hal ini dilatar belakangi oleh 3 alasan.
Alasan pertama adalah terjadinya overspecified,
yaitu terlalu banyak variabel yang
dimasukan ke dalam model. Alasan kedua, model tidak mengandung variabel yang
tepat. Dan alasan ketiga, model tidak memiliki hubungan matematis yang benar
(Freund, Wilson, and Sa, 2006: 227). Terdapat beberapa metode untuk menyeleksi
variabel penjelas yang layak masuk dalam model sehingga diperoleh model terbaik.
Salah satu diantaranya yaitu Best Subset Regression (Hanum, 2011).
Best Subset Regression
memulai pemilihan dengan model paling sederhana
yaitu model dengan satu variabel. Selanjutnya dilanjutkan dengan variabel lain satu
per satu sampai didapat model yang
memenuhi kriteria terbaik. Terdapat beberapa
|