Korelasyon ve
Regresyon Analizi
Korelasyon :
Korelasyon, istatistikte iki değişken arasındaki ilişkinin
yönünü ve gücünü gösterir. Aralarındaki neden sonuç ilişkisini vermez. Öğrencinin
matematik dersine olan tutumunun matematik dersindeki başarı ile arasında
korelasyonel bir ilişki mevcuttur. Günlük alınan kalori miktarı ile kilo alma
arasında ve insanların boy uzunlukları ile ağırlıkları arasındaki ilişkide
korelasyon ilişkisi mevcuttur. Bu iki değişkenler arası lineer ilişkinin
derecesinin ilişkisini ölçmek için
kovaryans adı verilen bir ölçüt kullanılır.
Saçılım diagramı :
Saçılım diagramı üzerinde (X,Y) değişkenlerinin oluşturduğu
grafiktir. X değişkeni grafikte yatay eksen Y değişkeni dikey eksende
konumlandırılır. Saçılım diagramındaki değişkenler ilişkinin yönünü ve
şiddetini belirler.
Şekil : Değişkenler arası doğrusal ilişki grafikleri
X ve Y grafiği artan bir şekilde ise değişkenler arasi pozitif bir ilişkinin var olduğunu, X ve Y grafiği azalan bir şekilde ise negatif yönlü bir ilişkinin olduğu, X ve Y grafiğinde ortada toplanmış bir görüntü oluşursa değişkenler arası ilişkinin olmadığı varsayılır.
Pearson ilişki (Korelasyon) katsayısı (r)
İki değişken arasındaki doğrusal ilişkinin derecesi ve yönü hakkında bilgi verir. -1≤ r ≤ 1 arasındaki değerleri alır. Aşağıdaki tabloda r değeri ilişki düzeyi verilmiştir.
- +1,00′ a yaklaştıkça iki değişken arasında aynı
yöndeki ilişki artar.
- -1,00′ a yaklaştıkça iki değişen arasında ters
yönde ilişki artar.
- 0,00’a yaklaştıkça iki değişken arasındaki ilişki
azalır.
R Kare değeri :
İki değişken arasında bulunan korelasyon değerinin karesine R Kare değeri denir.
Bir değişkenin içindeki varyasyonun değişiminin bağımlı değişkende yaratacağı ortalama değişimi ifade eder.
Örneğin; iki değişken (X ve Y değişkeni) arası korelasyon 0.50 olsun, R Kare değeri 0.25 olacaktır. İfade olarak, X değişkeninin içerisindeki değişimin %25'lik kısmı Y değişkeni ile açıklanabilir. Tam tersi ifade olarak, Y değişkeni içerisindeki değişimin %25'lik kısmı X değişkeni ile açıklanabilir diyebiliriz.
Korelasyon Analizi :
Örnek : Öğrencinin aldığı Matematik sınavı puanları ile Fizik sınavı puanları arasında anlamlılık düzeyinde bir farklılık olup olmadığını inceleyelim.
Matematik ve Fizik sınavı sonuçları arasındaki anlamlı bir farklılığı incelemek için SPSS programındaki aşağıdaki adımları uygularız.
SPSS programına girilen puanların basit korelasyon analizini yapmak için 1. Adımda belirtilen ANALYZE>CORRELATE>BIVARIATE
adımları uygulanarak 2. Adıma geçilir. Aralarındaki ilişkiyi inceleyeceğimiz değişkenler VARIABLES kutusuna sürüklenir. Eğer verilerimiz normal dağılım gösteriyorsa, Corselation Coefficients başlığı altında bulunan seçeneklerden PEARSON, normal dağılım göstermiyorsa SPEARMAN seçeneği seçilir. Değişkenlerinize bir yön belirlemişseniz, hipotezinizde değişkenlerin biri artarken diğeri de artıyor veya tam tersi ilişki olarak azalıyor ise One-Tailed seçeneği seçilir. Yön belirtmeyip sadece ilişki vardır diyorsanız Two-Tailed seçeneği kullanılır. OK tuşuna bastığımızda karşımıza 3.adımdaki gibi tablo çıkacaktır. Buradaki tabloda anlamlılık oranı 0,05'ten küçük olup iki ilişki arası anlamlı ve pozitif bir ilişki vardır denir.
Kısmi Korelasyon :
İki değişken arasındaki ilişkiyi, bu değişkenlerle ilişkili olan bir veya birden fazla değişkeni kontrol altına alarak analiz edilir.
Örnek : Yaşın internet kullanma oranı ile sınav puanı oranı arasındaki ilişkiyi yaş değişkenini kontrol altına alarak inceleyelim.
SPSS programında ANALYZE>CORRELATE>PARTIAL adımları uygulanarak açılan pencerede VARIABLES kısmına kontrol altına alacağımız değişken hariç tüm değişkenleri alırız. Kontrol altına alacağımız değişkeni ise CONTROLLING FOR kısmına yazarız ve OK tuşuna basarız.
Yaş değişkeni kontrol altında iken pozitif yönde 0.33 oranında kısmi korelasyonun olduğu söylenir. Aşağıdaki tablodaki değer aralığımıza göre orta düzeyde bir ilişkinin olduğu ifade edilir.
Regresyon
Aralarında sebep-sonuç ilişkisi bulunan biri bağımlı diğerleri bağımsız değişkenlerin (birden fazla bağımsız değişken olabilir) arasındaki ilişkiyi matematiksel veya oran olarak ifade edilmesidir. Regresyon analizinde bir tane bağımsız değişken var ise basit regresyon analizi diye tanımlanır, birden fazla bağımsız değişken var ise çoklu regresyon analizi olarak adlandırılır. Aşağıdaki formül ile hesaplanır.
Örnek : Sebep Sonuç
Gelir Harcama
Sıcaklık Nem
Doğalgaz Tüketim Fatura Tutarı
Yukaridaki örnekler ile aralarında sebep-sonuç ilişkisi vardır. Basit regresyon analizinde iki değişken arasındaki R Kare ifadesine bakarak matematiksel oran ifadesinde bulunuruz.
Basit Regresyon :
Örnek : Öğrencilerin zeka seviyesi (IQ değeri) ile sınav puanları arasındaki ilişkiye bakalım.
SPSS programında ANALYZE>REGRESSION>LINEAR adımları uygulanarak DEPENDENT kısmına bağımlı değişken olan puan değerini, INDEPENDENT kısmına bağımsız değişken olan IQ değerini yazarız.
OK tuşuna basıp tablomuzu inceleriz.
Bağımsız değişken olan zeka seviyesi (IQ değeri) ile bağımlı değişken olan sınav puanları arasındaki varyansı
%72 (R Kare) oranı ile açıkladığı, sınavdan alınan puanın %72'si zeka seviyesine bağlı olduğu söylenir.
ANOVA analizinde anlamlılık düzeyinin 0,01< p <0,05 arasında olduğu için ilişkinin anlamlı olduğu görülür.
Katsayı (Coefficients) tablosu bizlere regresyon katsayılarını ve bunların anlamlılık düzeyini verir. Tabloda IQ değişkeninin katsayısı 0,989 ve denklemin sabit değeri 1,217'dir.
Çoklu Regresyon :
İkiden fazla bağımlı değişkenin bağımlı değişken üzerindeki aetkisini incelemek için kullanılır.
Örnek : Gelir düzeyine göre okuldaki basarı puanı ve IQ seviyesi arasındaki ilişkiyi inceleyelim.
SPSS programında ANALYZE>REGRESSION>LINEAR adımları uygulanarak DEPENDENT kısmına bağımlı değişken olan gelir değerini, INDEPENDENT kısmına bağımsız değişken olan IQ ve Puan değerlerini yazarız, ardından OK tuşuna basarız.
Bağımsız değişkenler olan IQ ve Puan değeri, bağımlı değişken olan gelir değerine ait varyansı %81 oranında açıkladığı, diğer bir ifadeyle gelir değerinin %81 oranında IQ ve başarı puanına bağlı olarak şekillendiğini ifade eder.
ANOVA tablosu incelendiğinde, anlamlılık düzeyi 0,01 < p < 0,05 arasında olduğu için istatistiksel olarak anlamlı olarak ifade edilir.
Hiç yorum yok:
Yorum Gönder
Not: Yalnızca bu blogun üyesi yorum gönderebilir.