16
mengandung variabel yang
tepat. Dan alasan ketiga, model tidak memiliki hubungan
matematis yang benar (Freund, Wilson, and Sa, 2006). Terdapat beberapa metode untuk
menyeleksi variabel penjelas yang layak masuk dalam model sehingga diperoleh model
terbaik. Salah satu diantaranya yaitu Best Subset Regression (Hanum, 2011).
Best Subset Regression mengidentifikasi
model regresi
terbaik
yang dapat
dibentuk
dengan variabel penjelas. Selain itu, Best Subset Regression digunakan untuk
mengklasifikasi model terbaik (Asadi, Raoufar and Nassiri, 2012). Metode ini
merupakan cara yang efisien untuk mengidentifikasi model dalam mengestimasi variabel
dependen dengan beberapa variabel penjelas (Nirmalraj dan Malliga, 2011). Best Subset
Regression
memulai pemilihan dengan model yang paling sederhana yaitu dengan satu
variabel penjelas. Selanjutnya dilanjutkan dengan variabel penjelas lain satu per satu
sampai didapat model yang memenuhi kriteria terbaik.
2.5. Statistik ©-p Mallow
Statistik C-p Mallow
dikembangkan oleh Colin Mallows sebagai alat dalam
menentukan estimasi untuk pengunaan jumlah variabel penjelas regresi. Statistik C-p
Mallow
membandingkan ketepatan dan bias dari model penuh dengan model subset
terbaik dari jumlah variabel penjelas. Sebuah model dengan terlalu banyak variabel
penjelas dapat menghasilkan model yang tidak tepat. Sedangkan untuk model dengan
satu variabel penjelas terlalu sedikit sehingga dapat menghasilkan estimasi bias
(Nirmalraj dan Malliga, 2011). Pada statistik C-p Mallow, model yang baik memiliki
nilai statistik C-p Mallow
mendekati jumlah parameter. Selain itu, diketahui juga model
dengan nilai C-p Mallow
yang kecil yang akan digunakan (Lindsey dan Sheather,
2010:650-669).
|