Uji Multivariat Outlier
by. Salman Paludi ~ Pebruari 2017
Outliers
adalah observasi yang muncul dengan nilai-nilai ekstrim baik secara univariat
maupun multivariat yaitu yang muncul
karena kombinasi karakteristik yang unik yang dimilikinya dan terlihat sangat
jauh berbeda dengan observasi-observasi lainnya. Outliers pada dasarnya
dapat muncul dalam empat kategori:
1) Outliers
muncul karena kesalahan prosedur seperti kesalahan dalam memasukkan data atau
kesalahan dalam mengkoding data.
2) Outliers
muncul karena keadaan yang benar-benar khusus yang memungkinkan profil data
lain daripada yang lain, tetapi peneliti memiliki penjelasan mengenai apa
penyebab munculnya nilai ekstrim tersebut.
3) Outliers
muncul karena adanya suatu alasan tetapi peneliti tidak dapat mengetahui apa
penyebabnya atau tidak ada penjelasan mengenai sebab-sebab munculnya nilai
ekstrim tersebut.
4) Outliers
dapat muncul karena range nilai
jawaban responden, bila dikombinasi dengan variabel lainnya kombinasinya
menjadi tidak lazim atau sangat ekstrim, yang sering dikenal dengan multivariate outliers.
Outlier menggambarkan data atau skor yang terletak sangat
jauh (ekstrim) dari kelompok lainnya. Univariat outlier skor ekstrim dalam variabel sedangkan multivariate outlier adalah skor ekstrim
dalam dua atau lebih variabel. Outlier
dapat berpotensial menciptakan heywood case atau improper solution. Selain itu outlier
dapat menyebabkan bentuk distribusi data menjadi tidak normal, menciptakan
bias dalam taksiran parameter serta berpengaruh terhadap hasil signifikansi pengujian
parameter tersebut. Pemeriksaan multivariat
outlier dapat dilakukan dengan statistik Mahalanobis Distance (d2) yang berdistribusi chi square (χ²) dengan derajat kebebasan
(df) sejumlah variabel pengamatan (p). Nilai
Mahalanobis Distance (d2) data pengamatan yang lebih dari nilai chi square (χ²) dengan derajat bebas df
variabel pengamatan p dan tarap signifikansi misal <0,001 maka dikatakan
sebagai data multivariate outlier. Cara mengidentifikasikan terjadinya
multivariat outliers adalah dengan menggunakan statistik d² (Mahalanobis
Distance) dan dibandingkan dengan nilai χ² dengan tingkat kesalahan 0,001,
df sebanyak variabel yang dianalisis. Untuk jumlah pertanyaan sebanyak 77 buah dalam
Microsoft Excel 2010 dengan rumus
=CHIINV(0.001,77) diperoleh nilai 121,1. Pemeriksaan multivariat outlier diolah dengan bantuan software SPSS 20.
Jika
d² > χ², 0,001,df=77 atau d²>121,1 maka terdapat multivariat outlier.
Jika d²< χ², 0,001,df=77 atau d²<121,1
maka tidak terdapat multivariat
outlier.
Jumlah awal data
observasi adalah sebanyak 300 data observasi. Berikut hasil pengujiannya dengan
software SPSS 20 dalam gambar berikut:Gambar hasil output pengujian multivariate outlier di SPSS :
Dalam pengujian multivariate outlier di
atas ditemukan dua puluh data yang outliers
yaitu data observasi nomor 279, 265, 264, 281, 262, 268, 263, 280, 261,
266, 277, 269, 278, 260, 259, 267, 276, 300, 29 dan 158 yang memiliki nilai Mahalanobis
Distance d² > χ², 0.001,df=37 (121,1). Sehingga kedua puluh data
tersebut dikeluarkan dari total data observasi agar dalam pengolahan data tidak terdapat multivariate
outliers. Setelah itu data observasi diolah kembali dan dihasilkan output:
Mahalanobis Distance (d2) maximum =
109,590, dengan nilai χ², 0.001,df=37
adalah 121,1 maka data yang diobservasi sebanyak 280 data tidak terdapat multivariate outlier.
daftar pustaka :
Paludi, Salman, 2016. Analisis Pengaruh Electronic Word Of Mouth (E-Wom) Terhadap Citra Destinasi, Kepuasan Wisatawan, Dan Loyalitas Destinasi Perkampungan Budaya Betawi (PBB) Setu Babakan Jakarta Selatan. Tesis, MM IBN Jakarta
Ferdinand, Augusty. 2006. Structural Equation Modeling dalam Penelitian Manajemen : Aplikasi Model-Model Rumit dalam Penelitian untuk Tesis Magister dan Disertasi Doktor. Semarang: Badan Penerbit Universitas Diponegoro. ISBN 979.9156.75.0
Yamin, Sofyan & Kurniawan, Heri, 2009. Structural Equation Modeling Belajar Lebih Mudah Teknik Analisis Data Kuesioner Dengan Lisrel-PLS. Jakarta: Salemba Infotek
Ferdinand, Augusty. 2006. Structural Equation Modeling dalam Penelitian Manajemen : Aplikasi Model-Model Rumit dalam Penelitian untuk Tesis Magister dan Disertasi Doktor. Semarang: Badan Penerbit Universitas Diponegoro. ISBN 979.9156.75.0
Yamin, Sofyan & Kurniawan, Heri, 2009. Structural Equation Modeling Belajar Lebih Mudah Teknik Analisis Data Kuesioner Dengan Lisrel-PLS. Jakarta: Salemba Infotek
No comments:
Post a Comment