Kamis, 13 November 2014

Regresi Ganda



Regresi Ganda dan Regresi dengan Satu Prediktor
Sebenarnya pemikiran mengenai analisis regresi ganda itu seperti melakukan beberapa kali analisis regresi, satu kali untuk tiap prediktor. Analisis regresi ganda menjadi lebih rumit karena seringkali kedua prediktor memiliki hubungan yang mempengaruhi hubungan tiap prediktor dengan kriterion. Hal ini yang membuat hasil analisis regresi dengan menggunakan lebih dari satu prediktor akan berbeda dengan analisis regresi untuk tiap prediktornya. Perbedaan muncul misalnya dalam hasil estimasi b dan R2 nya.

Contoh =  ketika kedua prediktor memiliki korelasi yang sangat kecil dan hampir nol. Anggaplah ada dua prediktor yaitu a dan b dan satu kriterion c. Yang pertama saya melakukan analisis regresi dengan melibatkan satu prediktor saja. Hasil analisis dengan menggunakan SPSS 16 dapat dilihat sebagai berikut:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhfRaF0kAsKoTbNLpMHQ-zvq6IXTMJgX-Wb8s4jM7GWMmdfiLbbDonJWQpCTbxEefddmEXIiGnAkkWFt0CdMs7RDLoJZGLyRUgn2LxJivWt7MHiUjcgeUxaIv9oMKEMaFkubM2Vw-By3vAh/s400/analisis+regresi+ganda001.jpgGambar 1. R kuadrat dengan melibatkan a saja

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjq4OPsVm2-KWEVKn9Udn2jBwHax_htQF6KgqMs-NNCXTLpZM4fPv9qWQO0cxl2vgKk7pHs0Tss3dWUOv8hTsWWyHBI47fs6zd6EzZrrUl7jqYP2Vg9qd9iWdb6NW1mVYgWxaJW_Ccr1Wtq/s400/analisis+regresi+ganda002.jpgGambar 2. R kuadrat dengan melibatkan b saja

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgtWWBs9TtkdQgmS4v8hRioOKYWwklP_MEmG7E3PWAYSXTStXhwJbriLZ_QMBukojdW-IpIV1kiO4uB8XLHxVrm7Xbnvja-WWo3Z4cuosBR8FT9sMXgw39cD4X5axm2hW9a78GUNff-uuX9/s400/analisis+regresi+ganda003.jpgGambar 3. R kuadrat dengan melibatkan a dan b

Dari ketiga tabel di atas dapat dilihat bahwa nilai R kuadrat yang dihasilkan dari analisis regresi yang melibatkan dua prediktor kurang lebih adalah jumlah dari R kuadrat dari analisis regresi untuk tiap prediktornya: 0.549 =0.478+0.070.
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgWAV-ybRcEFkauo7UAFk9Qev4SG-28jd576w9JdyGlzYpMlqyuvmJOQ9MYhFPmuWtbSb5kVGX2ic485JDGna-MW24E3JXXbQ5_HBmIsNDFjh7aDyhTn7Cwtrr0Z-HB6AoxfhNw58a5opy2/s400/analisis+regresi+ganda002.jpg
Gambar 4. nilai slope dengan melibatkan a saja
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiJQK1sd0k00BotTrIm8Nw8qeLuAqrHoHrZNqnMwyZnc7dpORp0nMSbk6EYLfUnfUPT5ZGOR-eTzMoGJ2mn52sRGVKWAWGQRvdKhw1mlF1CjPjS1vzfzLkdx4feNIctXjRsjT1NAl32vwbw/s400/analisis+regresi+ganda004.jpg
Gambar 5. nilai slope dengan melibatkan b saja
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh33KIi9Cqrq-nDWd0Qx-B9wTHwWtcafYcZvswIEwDRIfN_BQ_RSIe5ifb4Gp1Mb7F9sUJydlQp9wyAY93TmM96U0Ptb-y9Y5ehe35m_H2o93cVmfhih1d3iMEjrqdllO3aO11XPoZPA3W2/s400/analisis+regresi+ganda006.jpgGambar 6. nilai slope untuk tiap variabel dengan melibatkan a dan b

Dari gambar 4 sampai 6, dapat kita lihat bahwa besarnya slope untuk tiap variabel kurang lebih sama antara slope yang didapatkan dari hanya melibatkan satu prediktor dengan slope yang didapatkan dari dua prediktor.

Hal ini terjadi karena bagian dari variasi d yang dijelaskan oleh a adalah murni bagian yang terpisah dari bagian variasi d yang dijelaskan oleh b, karena kedua prediktor tersebut tidak berkorelasi. Begini gambarnya:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj87l9Vbn3w6PBHLZllZOdccmhi78zBLiF4qL41CJ3kIpvpGa8eOLRpp0SR0RjYRo3GGVDujr8n8TpWLjYVniyaqjcrQ2z2SKUXcdjgWIBvgZ-K7wgsnciWs0kbgc3wiLkQjOXH2P9d0uSF/s400/analisis+regresi+ganda007.jpgGambar 7. Ilustrasi regresi dengan dua prediktor yang tidak saling berkorelasi.

Tentu saja kita akan sangat jarang berhadapan dengan situasi ini. Situasi lain yang lebih sering dijumpai dalam penelitian adalah ketika kedua prediktor saling berkorelasi. Korelasi dua prediktor ini mengakibatkan bagian dari variasi kriterion yang dijelaskan oleh prediktor yang satu bukan merupakan bagian yang murni terpisah dari bagian yang dijelaskan prediktor lain atau dengan kata lain ada overlap antara bagian yang dijelaskan oleh a dan b. Oleh karena itu bagian ini perlu diidentifikasi agar tidak terhitung ulang (lihat gambar 8.).
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjTLO7Dx0TgwjhaLuY2dVrJ9B2jKNmV66s5Zozih2Stj0XLf7L8fOAVajsAXbrOhv_TK6aUkPhZ1nJSG3b9kbSAJDjp-OpGhlhPSGsf7T4AzOaFokdgnFqae_chYSJ0Zn6wfzPgurPuYT5n/s400/analisis+regresi+ganda008.jpgGambar 8. Ilustrasi analisis regresi yang melibatkan dua prediktor yang berkorelasi

Estimasi Parameter dalam Regresi Ganda
Seperti yang dijelaskan sebelumnya, estimasi parameter dalam regresi ketika melibatkan lebih dari dua prediktor, perlu memperhitungkan korelasi antar prediktor. Ini tercermin dalam rumus-rumus untuk mencari tiap parameter.
Dalam artikel ini, penjelasan analisis regresi ganda melibatkan hanya dua prediktor saja demi kemudahan pemaparan. Oleh karena itu rumus dari garis prediksi yang akan dicari adalah
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhx0z0_PW03wSIVzPo-AQ838qaw1_lDf_iOgYX8sashAjZbf768msPOyMKeApAlqBBlDM7y78oG3Bseb0_o13s7xiufD4jOKst8x6-3HkU1SoH9BTvQeczIkNBg7NMxJ5Z6p6Q50l4wgerc/s400/analisis+regresi+ganda+rumus001.jpgSlope
Rumus untuk mencari b1 maupun b2 mirip. Dapat dilihat sebagai berikut:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgmiU_JxZDSRQtebz4DvJgxWIbR29I09tErVKJS91JfFfJ70gpwFSL9lJUNKt3wNMFEjwr-LkwRpYfbC16kS-GOtpWUtuyhNYHQBuTvfqJBeJz1yLpYhgv6jNVU-Zn8VaCe9hcFFwgX86-h/s400/analisis+regresi+ganda+rumus002.jpgDapat dilihat dalam kedua rumus di atas, bahwa nilai b selalu didapatkan dari korelasi antara variabel yang dicari b-nya dengan variabel dependen (ry1), yang kemudian dikoreksi dengan korelasi antara variabel independen lain dengan variabel dependen (ry2) dan korelasi antar variabel independen (r12).

Nah ketika korelasi antar variabel independen tidak sama dengan nol, maka dapat dikatakan korelasi ini ‘dibersihkan’ (partialed out) dari perhitungan nilai b atau dengan kata lain dikendalikan atau dikontrol. Oleh karena itu nilai b dalam analisis regresi ganda diinterpretasi sebagai “kenaikan nilai prediksi Y untuk setiap poin kenaikan nilai X dengan mengendalikan nilai variabel independen lain”. Atau “kenaikan nilai prediksi Y untuk setiap poin kenaikan nilai X jika nilai variabel independen lain tetap”. Dari sinilah kemudian ide mengenai korelasi parsial dan semi parsial muncul, yaitu korelasi antara dua variabel dengan mengendalikan (partial out) variabel lain.

Ketika korelasi antar variabel independen sama dengan nol (r12=0), maka akan terjadi :
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEirUsc80C-WJ3MA8ra1MJaPAvuy99GOBGxBwf3hwiLbGcPcn7zRkHjA0f4CpkhST6V14xUL4Lv9hiyGK7SWmgkgooifctdJYjxg1SgJcVUz1_HINrib3BWLgiJowK6v4cFiWCCVsoML9ARi/s400/analisis+regresi+ganda+rumus003.jpgJika kita lihat rumus b1 ini sama dengan rumus b1 pada analisis regresi dengan menggunakan satu prediktor saja, ini diakibatkan tidak ada korelasi yang ‘dibersihkan’ dari perhitungan nilai b, karena tidak ada korelasi antar variabel independen.

R kuadrat.
Perhitungan R kuadrat dalam regresi ganda dapat dilakukan dengan banyak cara. Cara pertama dilakukan dengan menjumlahkan R kuadrat untuk tiap korelasi antara variabel independen dengan variabel dependen, lalu dikoreksi.
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhJvggWdJjjpJjb42QfNxHs5UoK3tWX399oolmqgWnwZZezjFgkLmx4RRxt5PC9ZLUsx0tCx7GQyF6XNc0-TacV2f3zllRphuHrgOIMslR4082vZ6Yh8ZcWwRLJ1wIoWka545i9sfoEgG3h/s400/analisis+regresi+ganda+rumus004.jpgRumus di atas juga menunjukkan bahwa R kuadrat dari garis regresi ganda merupakan jumlah r kuadrat tiap variabel yang dikoreksi atau ‘dibersihkan’ dari korelasi antar variabel independen. Jika r12 = 0 makahttps://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjan_sJ9AMpXaWT8MDXGG6FsUyCQkPoayanWDIWN9mj1HyvdHNuT_bhfYDu3A_OUEV2GmTUOmaoa3JGhDrlxLyUq5PdZ_2nWypA5PWP7orUwGV33LD56ZDZDpl7nHcWIdHuSIfM-6sPnQlA/s400/analisis+regresi+ganda+rumus005.jpgSelain cara pertama itu, cara lain yang terhitung mudah adalah dengan mencari koefisien korelasi antara prediksi y dengan y dari data penelitian. Koefisien korelasi yang didapatkan kemudian dikuadratkan. Cara kedua ini dapat dinyatakan dalam bentuk seperti berikut:https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhNEoRUoEH-865fb0HzhHoJMubf6bsdgu5Epr88JgGzyck8yYRx07kGLbZcmknA-X1-jkd8ngWK9CxxEHmTYSr9gL7hSBUkk6O2DWjnlyYH3a5n3MLuj55JzzuFvKA2sbqGLy4zYNYHoMw0/s400/analisis+regresi+ganda+rumus006.jpg



















Regresi Ganda dalam SPSS

Contoh: Sebuah penelitian dilakukan untuk mengetahui korelasi dari nilai IPK mahasiswa dengan dua variabel lain yaitu nilai Tes Seleksi Masuk I dan Tes Seleksi Masuk II. Penelitian ini juga ditujukan untuk menemukan garis regresi untuk melakukan prediksi nilai IPK seorang mahasiswa berdasarkan informasi dari nilai Tes Seleksi Masuk I dan II.
Baiklah, langkah pertama adalah dengan membuka data dalam SPSS tentu saja. Yang diikuti dengan klik menu Analyze-Regression-Linear sehingga muncul dialog box seperti ini (gambar 9.)
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjM0ooCK1A7_wcHivLl7vCNQubLbsbGabGoGhGk89mdpn_FrEPCB_pJ8QfELzUdvR63OJoLhTgdf175S8SeEcM_xz9pZMjCDTxb2c5pVW99LW70TnZQwxeVku1GTHoGFeCiG6l3PqlRUvAI/s400/analisis+regresi+ganda009.jpgGambar 9.
Variabel Indeks Prestasi Kumulatif dimasukkan ke dalam kotak Dependent sementara Tes Seleksi I dan Tes Seleksi II dimasukkan ke dalam kotak Independent(s). Kemudian klik OK, sehingga ditampilkan hasil seperti berikut (gambar 10, 11,12):
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgp44eRoBGCVtE8w_ZyRt7UKkBx7whHPSIn-3aPvIAP7vISx7hpXQ49KF-cxCq2btBs09e-g7rTBCqI9Af1Xvv_pa5oea5_bjyrDHoHQwQ0UhIxOKBvCFQ1yv8oEYmiscJVH1TkvOE-SNae/s400/analisis+regresi+ganda010.jpgGambar 10.
Pada Gambar 10. ditampilkan tabel yang memberikan informasi mengenai besarnya R dan R kuadrat. R merupakan korelasi majemuk (multiple correlation) dari kedua variabel independen dengan variabel dependen. R kuadrat (R square) memberikan gambaran seberapa baik garis regresi dapat memberikan prediksi variabel dependen. Dalam hal ini 14% dari variasi variabel dependen yang dapat diprediksikan oleh garis regresi dengan menggunakan kedua tes seleksi sebagai prediktornya.
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhwcSlIxdUIbnG_uptZO_5-FBHYId9iS1sHepi59CNRMY8WeVGGWJSoIwIiJcs9EDuneimAl7SqhjuM59TfBEHQcwRwGbG4TewIlLdyqg9siob3f6A8i33hVVRIO1uKSKn0G3qiUBkEpLMu/s400/analisis+regresi+ganda011.jpgGambar 11.
Tabel dalam gambar 11, memberikan informasi mengenai signifikasi nilai R atau dapat juga dianggap sebagai uji hipotesis terkait dengan parameter-parameter regresi. Dalam tabel ditemukan nilai p (sig.) lebih kecil dari 0.05. Ini berarti nilai R secara signifikan berbeda dari 0 di populasi. Atau dapat juga diinterpretasi bahwa menggunakan garis regresi memberikan informasi lebih baik dibandingkan hanya dengan menggunakan mean dari variabel dependen. Interpretasi lain terkait dengan parameter, yaitu paling tidak ada satu nilai b yang signifikan. Jika kita membagi JK (Sum of Squares) dari Regression dengan JK dari Total, akan ditemukan nilai yang sama dengan R kuadrat.
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi8dAadBdK-hTB5w8qNCPYG38wAw5ShI1Zhu_Ke4dKiojqxRkrH8OYK0S17NFsjyK7K_5tazm7FuTgUb_zdsYyI_Rdj7156c_jir_j8Ghld2GnQK1EEhFCeDg9YVM5VrDxcVP-H9stxz8tH/s400/analisis+regresi+ganda012.jpgGambar 12.
Tabel berikutnya dalam gambar 12. memberikan informasi mengenai besarnya slope dan intercept serta signifikasi dari tiap koefisien tersebut. Slope untuk Tes Seleksi I adalah 0.049 sementara Tes Seleksi II adalah 0.090. Intercept dari persamaan garis regresi ini adalah 1.932. Semua parameter tersebut signifikan dengan taraf 5%. Ini berarti garis regresi untuk memprediksi IP Kumulatif mahasiswa adalah sebagai berikut:

Arti dari slope untuk Tes Seleksi masuk : dengan mengendalikan nilai Tes Seleksi II, tiap kenaikan satu poin dalam Tes Seleksi I akan diikuti oleh prediksi IPK sebanyak 0.049 poin. Atau : kenaikan 1 poin nilai Tes seleksi I akan diikuti oleh kenaikan prediksi IPK, jika nilai Tes Seleksi II tetap.
terima kasih







Tidak ada komentar:

Posting Komentar