2. Pendahuluan Suatu langkah penting dalam analisis regresi adalah menentukan apakah fungsi regresi dipengaruhi oleh satu, dua atau lebih dari variabel independen. Jika fungsi regresi dengan satu atau dua variabel independen, maka pendeteksian pencilan relatif tidak sukar. Tetapi jika fungsi regresi memiliki lebih dari dua independen, maka pendeteksian pencilan dengan grafis sederhana menjadi sulit sebab pemeriksaan satu atau dua independen tidak dapat selalu membantu menemukan pencilan relatif terhadap suatu fungsi regresi berganda. Suatu pencilan dalam regresi berganda bisa tidak terdeteksi dalam analisis regresi dengan satu atau dua independen. laporan ini akan membahas metode-metode pendeteksian pencilan maupun pencilan berpengaruh.
3. Leverage Test Pendeteksian pencilan secara inferensi yang dibahas pada laporan kali ini adalah Leverage ( hii ). Asal hii dari diagonal dari matriks HAT ( H ) dan dengan xi adalah vektor seperti pada persamaan Nilai hii dianggap besar mengidentifikasikan kasus pencilan jika melebihi .Dimana p adalah banyaknya parameter termasuk o dan n adalah jumlah pengamatan.
4. DFFITS DFFITS digunakan untuk mendeteksi pencilan berpengaruh pada nilai estimasi variabel dependen. Dengan = nilai estimasi variabel dependen ke- i dengan semua pengamatanikut dalam pembentukan model regresi. = nilai estimasi variabel dependen ke- i dengan tidak mengikutsertakan pengamatan ke- i dalam pembentukan model regresi. MSE( i ) = Mean Square Error dengan tidak mengikutsertakan pengamatan ke- i dalam pembentukan model regresi. hii = Leverage . Jika, (DFFITS) i >1 ( pencilan berpengaruh apabila data kecil) (DFFITS) i > (Pencilan berpengaruh apabila data besar)
5. DFBETAS DFBETAS digunakan untuk mendeteksi pencilan berpengaruh terhadap koefisien regresi. Dengan k = 0, 1, 2, ., p = Koefisien regresi dengan semua pengamatan ikut dalam pembentukan model regresi. = Koefisien regresi dengan tidak mengikutsertakan pengamatan ke- i dalam pembentukan model regresi. MSE( i ) = Mean Square Error dengan tidak mengikutsertakan pengamatan ke- i dalam pembentukan model regresi. = Unsur diagonal ke- k matriks ( X X )-1. Pedoman untuk mengidentifikasi kasus pencilan yang berpengaruh, disarankan untuk menganggap suatu kasus itu berpengaruh bila nilai mutlak (DFBETAS) k ( i ) lebih besar dari satu untuk data kecil dan nilai mutlak (DFBETAS) k ( i ) lebih besar dari untuk data besar.
6. Cooks Distance Cooks Distance (D i ) digunakan untuk mendeteksi pencilan berpengaruh terhadap semua koefisien regresi. b ( i ) = Vektor koefisien regresi dengan tidak mengikutsertakan pengamatan ke- i dalam pembentukan model regresi. b = Vektor koefisien regresi dengan semua pengamatan ikut dalam pembentukan model regresi. P = Banyaknya parameter termasuk o. MSE = Mean Square Error semua pengamatan ikut dalam pembentukan model regresi. Jika suatu pengamatan dikatakan Influence adalah jika nilai persamaan diatas lebih besar dari distribusi F (50%, p, n - p ).