Siapa yang diuji Normalitas, Si Residual atau Si Data?

Distribusi Normal

Distribusi Normal

Yup, inilah barangkali subjektifitas saya yang menemukan adanya perbedaan di kalangan peneliti tentang “siapa” yang semestinya dilakukan terhadapnya uji normalitas. Banyak kalangan peneliti, khususnya non statistikawan mengatakan bahwa data mentahlah yang mestinya diuji normalitasnya sebelum melakukan model regresi. Dan mungkin ada pula terjadi pendapat yang serupa di kalangan temen-temen statistika sendiri.

Pendapat di atas (yang mengatakan data asli harus berdistribusi normal) memang banyak dijumpai di penelitian-penelitian Tugas Akhir mahasiswa. Salah satu contoh, yang dilakukan oleh Soemartini (2007), dengan judul “PENGUJIAN BEBERAPA ASUMSI PADA DATA ROFITALITAS EKUITAS DAN BEBERAPA FAKTOR YANG MEMPENGARUHINYA” dari Jurusan Statistika, Universitas Padjadjaran. Pada bab 2 Tinjauan Pustaka disebutkan bahwa “Asumsi regresi mempunyai variable – variable yang berdistribusi normal. Variabel-variabel yang tidak berdistribusi normal ( kemiringan, kurtosis atau variable dengan outlier yang kuat) dapat menyimpangkan suatu hubungan dan uji signifikansi”. Namun sayang sekali di sana tidak disebutkan sumber referensi yang menyatakan demikian. Walaupun sepengetahuan saya memang ada beberapa buku lokal yang menyatakan demikian.

Namun, subjektifitas saya cenderung kepada yang mengatakan bahwa residual-lah yang semestinya diasumsikan berdistribusi normal, BUKAN data mentahnya. Hal ini didasarkan pada sumber referensi dari buku berjudul Applied Regression Analysis Third Edition karangan Draper and Smith, di halaman 60-61, dikatakan “Now in performing the regression analysis we have made certain assumptions about the errors; the usual assumptions are that the errors are independent, have zero mean, have constant variance, and follow normal a distribution. The last assumptions is required for making F-tests”.

Hal itu ditegaskan kembali pada sub-bab 2.4 yang secara khusus membahas tentang asumsi kenormalan dari residual.  Yaitu asumsi dimana residual saling independen satu sama lain, ei ~ N(0,σ).

Referensi lain dari buku “Hill, R.C., Griffiths, W. E., and Lim, G. C., and Berenson, M. L. (2011). Principles of Econometrics. 4th Ed. John Wiley & Sons, Inc. United States. ISBN: 9780470626733.”

2-10-2013 8-35-43 PM

Cara yang paling mudah untuk mengetahui kenormalan residual adalah dengan melakukan plot nomality residual. Adapun cara lain adalah semisal Kolmogorov-Smirnov, Chi-Square dan Shapiro Wilks Test.

Demikian penjelasan singkat tentang asumsi kenormalan residual untuk analisis regresi. Untuk mengetahui contoh pengitungan uji normalitas residual silahkan klik di sini. Semoga bermanfaat.

By : Azwar Rhosyied

7 thoughts on “Siapa yang diuji Normalitas, Si Residual atau Si Data?

  1. kl utk regresi memg yg d uji normalitas it sisaanny,,,krn utk memenuhi asumsi BLUE(best linier unbiased estimator)…ttp kl menggunakan uji parametrik yg d uji normalitas it datanya,,,krn uji parametrik sendiri mengasumsikan bhw data berdistribusi normal….

  2. Pak, saya mau tanya – jika misalnya residual melanggar asumsi normalitas, bbrp literatur kan menyarankan utk menormalkan residual tsb.
    Kemudian jika misalnya residual sdh b’hasil dinormalkan, lalu apakah model regresi yg semula msh digunakan atau kita harus cari model regresi baru?
    Mohon penjelasannya.
    Terima kasih.

  3. ketika asumsi residual normalitas tdak memenuhi, maka langkh selanjutny bukn mnormalkn residual.Tetapi dilakukan transformasi data dan pemodelan lgi supaya residual mnjadi normal.
    Jdi model yg digunakn adalh model trakhir ketika data sdh dtransformasi dn menghasilkn residual yg sdah normal..

  4. sorry mau tanya nih, dari kamilat atas tentang ‘Now in performing the regression analysis we have made certain assumptions about the errors; the usual assumptions are that the errors are independent, have zero mean, have constant variance, and follow normal a distribution. The last assumptions is required for making F-tests’ saya tidak membaca bahwa yg dikatakan itu harus normal di bagian residual / data mentah, blh tlg jelasin lagi?? thx..

    • Terimakasih atas pertanyaanya,
      Sebagai tambahan referensi, silahkan dibaca ulang referensi di atas.
      Telah saya tambahkan referensi.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s