Dasar Teori
Banyak analisis statistika
bertujuan untuk mengetahui apakah ada hubungan antara dua atau lebih variable. Bila
hubungan demikian ini dapat diinyatakan dalam bentuk rumus matematik, maka kita
akan dapat menggunakannya dala keperluan meramalkan subuah kejadian yang
mungkin terjadi. Misalnya, pengukuran-pengukuran dari data meteorology digunakan
secara meluas untuk meramalkan daerah-daerah yang akan terkena pengaruh
penembakan peluru kendali pada berbagai kondisi atmosfir. Seberapa peramalan
itu dapat dipercaya tentu saja bergantung pada keeratan hubungan antara
peubah-peubah dalam rumus matematik itu.
Regresi Linier
Persamaan matematik yang
memungkinkan kita meramalkan nilai-nilai suatu peubah tak bebas dari
nilai-nilai satu peubah atau lebih peubah bebas disebut persamaan regresi. Dalam
hal ini kita akan membicarakan masalah pendugaan atau peramalan nilai peubah
tak bebas(y) berdasarkan peubah bebas(x) yang telah diketahui nilainya.
Dengan mengamati diagram pencar
dari contoh di atas, terlihat bahwa titik-titiknya mengikuti garis lurus,
berarti kedua peubah saling berhubungab secara linier. Maka secara matematik
dengan sebuah garis lurus yang disebut garis regresi linier.
Ŷ
= a + bx
Dalam hal ini a menyatakan
intersep atau perpotongan dengan sumbu tegak dan b adalah kemiringan atau
gradiennya. Ŷ digunakan untuk membedakan antara nilai ramalan yang dihasilkan
dari regresi dan nilai pengamatan y yang sesungguhnya untuk nilai x tertentu. Bila
nilai a dan b diperoleh dari data, maka garis regresinya dapat digunakan untuk
meramalkan Ŷ.
Asumsi-asumsi Regresi Linier Sederhana :
- Variable y berdistribusi normal, variable x
bersifat tertentu, error (ε) diasumsikan berdistribusi normal dengan
rata-rata nol dan variansi satu.
- Variable y mempunyai sifat homoskedasitas,
berarti variansi nilai-nilai y disekitar nilai rata-rata adalah konstan.
- Error bersifat independen (saling bebas)
- Hubungan variable dependen dan variable
independen adalah linier.
Model Regresi Sederhana
Misalkan diberi n-pasangan observasi (sampel berukuran n): (y1,x1),
(y2,x2), …., (yn.xn) ; maka model regresi linier dapat ditulis dalam bentuk:
Yi = β0 + β1x1 + ε
Dimana i=1,2,3,..,n
Koefisien β0 dan β1 dapat ditentukan dengan metode
kuadrat terkecil, yaitu dengan meminimalkan jumlah kuadrat error (jarak
vertical antara data dengan garis tengah regresi).
Parameter a dan b diperoleh dengan cara meminimalkan jumlah kuadrat
error (metode kuadrat terkecil), yaitu :
b=[(n).(ε xi.yi) – (ε xi).(ε yi)] / [(n).(ε
xi2) – (ε xi)2
a=[(Σy)/n] – [b.(Σx)/n]
Kecocokan Model
1. Pengujian hipotesis regresi linier sederhana
Dilakukan
pengujian hipotesis bahwa slope(β1) sama dengan sebuah konstanta sebagai
koefisien regresi. Pengujian hipotesis dilakukan sebagai berikut :
1. Pengujian hipotesis regresi linier sederhana
· Uji
hipotesis
H0 : β1 = 0
H1 : β1 ≠ 0
· Uji
statistika
Fo = (JKR/1) / (JKG/(n-2))
= [Σ (ŷ-rataan y)2/1] / [Σ(yi-ŷ)2/(n-2)]
Yang mengikuti distribusi F(α,1,n-2)
dengan derajat bebas (banyaknya variable bebas) dan n-2
· Daerah
kritis
H0 ditolak jika F0>F(α,1,n-2)
Jika H0 ditolak, berarti menerima H1 : β1 ≠ 0 sehingga
β1 merupakan nilai sebuah konstanta sebagai koefisien regresi linier dengan
tingkat signifikansi (1-α)100%
Sebuah
aplikasi model regresi adalah ramalan observasi-observasi y yang baru atau yang
akan datang berhubungab dengan sebuah nilai observasi variable bebas. Jika Xt
adalah nilai variable bebas untuk meramal obsevasi Yt, maka ŷt=a+bXt, merupakan
perkiraan tunggal nilai baru.
R2= JKR/Syy = [Σ(ŷ-rataan y)2] /
[Σ(yi-rataan y)2]
Nilai
R2 merupakan 0≤ R2≤1 yang merupakan jumlah
variabilitas dalam data dan variable bebas x yang diperoleh dalam model
regresi.
Koefisien
korelasi digunakan untuk mengukur hubungan antar variable prediksi y dengan variable
bebasx. Nilai koefisien korelasi
= CoV(x,y)/Sx Sy
Berdasarkan
n-pasangan observasi )sampel dengan ukuran n):
(y1,x1),
(y2,x2), ….. ,(yn,xn)
CoV(x,y)
= 1/n Σ (xi-rataan x)2
Untuk
mempertimbangkan ketepatan model dapat dicek dengan menghitung koefisien determinasi,
R2= JKR/Syy = [Σ(ŷ-rataan y)2] /
[Σ(yi-rataan y)2]
Nilai
R2 merupakan 0≤ R2≤1 yang merupakan jumlah
variabilitas dalam data dan variable bebas x yang diperoleh dalam model
regresi.
Model Regresi Nonlinier
Seringkali dijumpai hubungan antara variabel tak bebas dan variabel bebas
dalam bentuk model regresi yang tidak linier (non-linier). untuk menyelesaikan
model regresi non-linier dapat digunakan transformasi dari model non-linier
menjadi model linier. selanjutnya penyelesaian model linier tersebut dapat
menggunakan cara yang sama seperti pada model regresi linier.
Contoh
model regresi non linier misalnya adalah model garis y=x2 dengan
menggunakan transformasi v=x2 atau z=y1/2, maka garis
non-linier y=x2 dapat diubah menjadi garis linier, yaitu y=v atauz=x
Referensi : PENGANTAR STATISTIKA, RONALD E WALPOLE
Tidak ada komentar:
Posting Komentar