Bu Türkçe dokümanda, SPSS ile T-Test, Anova Test, Factor Analysis, Regression gibi yaygın işlemlerin nasıl yapıldığını açıklıyorum. Bu doküman, doktora yıllarımdaki çalışma notlarımı içermektedir.
2. 2 SPSS Manual
Contents
Frequencies ............................................................................................................................................. 3
Difference Test ........................................................................................................................................ 4
One Sample T-Test .............................................................................................................................. 4
Independent Sample ........................................................................................................................... 6
Anova Test........................................................................................................................................... 7
Paired Samples T Test........................................................................................................................ 10
Factor Analysis....................................................................................................................................... 11
Reliability Test ....................................................................................................................................... 22
Back To Factor Analysis ..................................................................................................................... 28
Total Score............................................................................................................................................. 30
Örnek................................................................................................................................................. 30
Total Score......................................................................................................................................... 32
Multiple Regression............................................................................................................................... 35
Ön Hazırlıklar..................................................................................................................................... 35
Regression ......................................................................................................................................... 45
Yorum ................................................................................................................................................ 50
Örnek Conclusion .................................................................................................................................. 50
3. 3 SPSS Manual
Frequencies
Verimiz hakkındaki demografik bilgilerin Mean’lerini, vs görmek için şu yolu izliyoruz:
Açılan pencereye, istatistiklerini görmek istediğimiz değişkeni atıyoruz.
“Statistics” menüsünde, hangi istatistikleri görmek istiyorsak seçebiliriz.
4. 4 SPSS Manual
Bu örnekte; (Valid Percent’e bakarsak) katılımcıların %54’ünün kadın, %46’sının erkek olduğunu
görebiliriz. Yukarıdaki tabloda da; Mean, Median gibi çeşitli özellikleri yer alıyor.
Difference Test
Analyse Compare Means: Mesela erkek ve kadınların bağlılıklarını karşılaştırmak istiyorsun. O
zaman, kadın ve erkek Sample’larn ayrı ayrı Mean’lerini hesaplayarak birbiriyle karşılaştırabiliriz.
Indepent sample t test: 2 group comparison (Education: Lise, Üniversite)
Anova: More than 2 groups (Education gibi: Lise, Üniversite, Master, vs)
One Sample T-Test
One-Sample Test
5. 5 SPSS Manual
Test Value = 20
t df Sig. (2-tailed)
Mean
Difference
95% Confidence Interval
of the Difference
Lower Upper Lower Upper Lower Upper
Hourly Salary ,214 2910 ,831 ,01586 -,1296 ,1613
,831: Hourly Mean’ın 20 olduğunu kabul ediyoruz
Mean’i zaten önceden biliyorduk, o yüzden gerçek hayatta bu testi yapmanın bir anlamı yok.
6. 6 SPSS Manual
Independent Sample
Burası şöyle yorumlanıyor:
İlk satırdaki “Sig.” değeri 0,05’in altında olduğu için, ikinci satırın “Sig. (2 tailed)” değerine
bakacağız (üzerinde olsaydı ilk satırınkine bakacaktık)
İkinci satırdaki “Sig. (2-tailed)” değeri 0,05’in üzerinde olduğu için, H0’ı reddediyoruz. Yani,
kadın ve erkekler arasında bir fark var.
Group Statistics
Cinsiyet N Mean Std. Deviation
Std. Error
Mean
Baðlýlýk Kadýn 104 4,0529 ,93650 ,09183
Erkek 92 4,2826 ,65278 ,06806
4,2826: Kadın & erkeklerin Mean’leri arasında fark olduğunu burada da görüyoruz
7. 7 SPSS Manual
Anova Test
Anova’nın ön şartları:
H0 accept olmadığı sürece Anova test yapılamaz
Sample Size’ların 30’dan daha büyük olması gerekiyor
Test of Homogeneity of Variances
Hourly Salary
Levene
Statistic df1 df2 Sig.
,593 2 2908 ,553
,553: Burası, Annova’yı kullanabilir misin kullanamaz mısın onu söylüyor. Bu durumda kullanabiliriz.
Önce, eğitim durumu ve bağlılık ilişkisine bakalım:
8. 8 SPSS Manual
Sonuçlar:
ANOVA
Baðlýlýk
Sum of
Squares df Mean Square F Sig.
Between Groups 1,945 3 ,648 ,959 ,413
Within Groups 129,743 192 ,676
Total 131,687 195
,413: Bütün eğitim seviyelerinin Mean’lerinin aynı olduğunu kabul ediyorum. Böylece anlamı kalmadı.
(çünkü 0.05’den büyük)
Eğer buradaki Sig. 0,05’den daha küçük çıksaydı, sonucu nasıl yorumlayacaktık? Aşağıda, bir başka
örnekten alınma bir yorum var. Burada, eğitim seviyeleri (1,2,3,4,5,6) ile bağlılık arasındaki ilişki
inceleniyor.
Sum of
Squares
df Mean Square F Sig.
Between Groups 13,568 5 2,714 4,845 ,000
Within Groups 268,860 480 ,560
Total 282,428 485
Anova’daki Sig. değeri 0,05’den küçük olduğu için şu sonuca varıyoruz: Değişik eğitim seviyeleri, değişik bağlılık
derecesine sahipmiş.
(I) Education (J) Education Mean Diff.
(I-J)
1,00 2,00 -1,96154
3,00 -1,98860(*)
4,00 -2,02145(*)
5,00 -2,23191(*)
6,00 -1,57692
2,00 1,00 1,96154
3,00 -,02707
4,00 -,05991
5,00 -,27037
6,00 ,38462
3,00 1,00 1,98860(*)
2,00 ,02707
4,00 -,03284
9. 9 SPSS Manual
5,00 -,24331
6,00 ,41168
4,00 1,00 2,02145(*)
2,00 ,05991
3,00 ,03284
5,00 -,21046
6,00 ,44452
5,00 1,00 2,23191(*)
2,00 ,27037
3,00 ,24331
4,00 ,21046
6,00 ,65499
6,00 1,00 1,57692
2,00 -,38462
3,00 -,41168
4,00 -,44452
5,00 -,65499
Education N Subset for alpha = .05
1 2
1,00 2 1,3462
6,00 6 2,9231 2,9231
2,00 2 3,3077
3,00 54 3,3348
4,00 321 3,3676
5,00 101 3,5781
Sig. ,051 ,860
Yukarıdaki sonuçları şöyle yorumluyoruz: “Yıldızlılar, birbirinden farklı imiş”. Demek ki, ilkokul
mezunlarını (1) bağlılık derecesi, lise (3) üniversite (4) ve master (5) mezunlarının bağlılık
derecesinden daha farklı imiş.
10. 10 SPSS Manual
Paired Samples T Test
Bunu yapabilmenin ön koşulları:
Pre ve Post diye iki tane grup yapacaksın (mesela diyet öncesi kilo ve diyet sonrası kilo)
Pre ve Post gruplarına ait olan kişiler aynı denekler olmak zorundadır.
Paired Samples Statistics
Mean N Std. Deviation
Std. Error
Mean
Pair 1 Weight 198,38 16 33,472 8,368
Final weight 190,31 16 33,508 8,377
198,38: “Before” ortalama kilo
190,31: “After” ortalama kilo
Paired Samples Test
t df Sig. (2-tailed)
Mean Std. Deviation
Std. Error
Mean
Lower Upper
Pair 1 Weight - Final weight 11,175 15 ,000
,000: Accept
11. 11 SPSS Manual
Factor Analysis
Faktör analizi ile SERVQUAL SATISFACTION ilişkisine bakıyoruz diyelim. Bu sayede, ServQual’a ait
hangi faktörler Satisfaction’u ne kadar etkiliyor bunu buluyoruz.
Eğer 5 ölçekli 100 sorum varsa, en az 500 kişiye anket yapmam lazım.
Soru 1’den 22’ye kadar olan kısmı seçip sağa attık.
12. 12 SPSS Manual
Anti-image: Her bir soru (tek tek) faktör analizine uygun mu?
1. Covaraince matrix > 0,50 olmalı
KMO: Bu soru grubu faktör analizine uygun mu?
1. KMO > 0,50 olmalı 1
2. Barlet P < 0,05 olması gerekiyor
1
Eğer KMO 0,50’nin altında çıkarsa, daha fazla anket yapman lazım anlamına gelir.
14. 14 SPSS Manual
KMO 0,50’den büyük, OK. Barlett sig. 0,05’in altında, OK.
Buradaki 1. sorunun Anti-image Correlation’u 0,50’nin altında. Bu yüzden, modelimden çıkarıyorum
ve analizi tekrar yapıyorum.2
2
Tablodaki diğer soruların tamamının değeri 0,50’nin üzerinde. O yüzden sadece 1. soruyu iptal etmem yeterli.
16. 16 SPSS Manual
Burada, en yüksek Loading’e sahip soruları bir araya getiriyoruz (satırlar). Her bir sorunun karşısında,
hangi Component’dan en fazla Loading gelmiş görebiliyoruz (sütunlar).
Buraya çift tıkla, sağ tıkla, Toolbar’ı seç. Bu şekilde istediğin şeyleri Bold yapabilirsin. ,100’den fazla
olanları Bold yapalım:
17. 17 SPSS Manual
Bir faktörün altında tek bir soru kalacak olursa, o soru analizden çıkarılır. Zira, bir faktörü tek bir
soruyla ölçemezsin. Bu durumda, faktör analizimizden soru 14’ü çıkartacağız.
Şimdi şartlar değişti:
19. 19 SPSS Manual
Burada dikkat edilmesi gereken bir nokta var: Bir soru birden fazla faktör altında yakın factor
loading’ine sahipse, o soru analizden çıkarılır. Yukarıda 20. soruya bakalım. 1 ve 2. sorularda değerler
çok yakın. O yüzden analizden çıkartacağız. Şimdiki durumumuz şöyle:
20. 20 SPSS Manual
0,50’den daha düşük loading’i olan sorular analizden çıkarılır. Örnekte soru 6’yı atıyoruz.
Soru 6’yı atıp soruların uzun metinlerini tekrar yerine koyduktan sonra tekrar çekiyoruz.
21. 21 SPSS Manual
Artık sonuca iyice yaklaştık. Mesela ilk faktöre karşılık gelen 5 soruya bakarsak, hepsi güvenle ilgili
yorumunu getirebiliriz.
22. 22 SPSS Manual
Reliability Test
Şimdi sırada Reliability Test var. Bu bize faktörlerin güvenilir olup olmadığın gösteriyor.
ADIM 1: Demin F1’in altına denk gelen sorulara bakacağız. Maksat, 1, faktörü test etmek. Girdikten
sonra istatistiklere bak.
23. 23 SPSS Manual
0,765 > 0,70 olduğu için güvenilir diyoruz. (eğer soru sayısı azsa 2-3 soru ise 0.60 olabilir)
Burada şunu görüyoruz:
1. 15. soruyu silersek, güvenilirlik 0,704 olur.
2. 16. soruyu silersek, güvenilirlik 0,720 olur.
3. ....
4. 19. soruyu silersek, güvenilirlik 0,734 olur.
Söz konusu Case’de, silinen herhangi bir soru güvenilirliği hissedilir derecede arttırmıyor. O yüzden
hiçbir soruyu atmayacağız.
ADIM 2: F2’nin sorularına bakacağız.
0,036 çıktı. Bu garip bir durum. İkinci soruda negatif bir değer vardı, bu yüzden olabilir.
24. 24 SPSS Manual
Bunun sebebi, sorunun Reverse olmasıdır. Mesela “.... ne değildir” gibi.
Bu problemi ortadan kaldırmak için, bir transformasyon yapacağız ve Soru 12’ye verilen bütün
cevaplarda Scale’i çevireceğiz: 3
1. 5 olacak
2. 4 olacak
3. 3 olacak
4. 2 olacak
5. 1 olacak
Buradaki maksat soruları aynı düzleme getirmek. Çok pozitif az negatif soru varsa, negatifleri ters
çeviriyoruz. Çok negatif az pozitif soru varsa, pozitifleri ters çeviriyoruz.
3
Bu işlemin nasıl yapıldığını geçen derste yapmıştık. Transform Recode...
25. 25 SPSS Manual
Yeni değişkenimiz oldu şimdi:
Şimdi Reliability’e yeni değişkenimiz ile tekrar bakacağız:
26. 26 SPSS Manual
Bu sefer düzgün çıktı.
Factor 3
644 çıktı.
Eğer 22. soruyu analizden çıkarırsam, güvenilirlik 0,693’e çıkarakmış. 22. soruyu atıp tekrar
deneyelim:
27. 27 SPSS Manual
Daha fazla yükselten birşey yok. O yüzden bu halde bırakıyoruz.
Factor 4
0,60’ın altında çıktığı için, bu Factor’u tamamen atıyorum. Soru 2, 3 ve 9 çöpe gitti.
Factor 5
0,60’ın altında. Bu factor de çöpe gidiyor (Soru 7 ve 13).
28. 28 SPSS Manual
Back To Factor Analysis
Şimdi yukarıda elediğimiz soruları (2, 3, 9, 7, 13) çıkartıp tekrar faktör analizi yapıyoruz. Ve soru 12
yerine recode 12’yi kullanacağız. Ardından, tekrar Reliability Test.
Yeni durum şöyle oldu:
F1 F2 F3
16 2 5
15 10 4
19 12 11
18 21
17
Rel: 0,765 Rel: 0,734 Rel: 0
12. soru, gruptaki diğer sorularla anlamsız olacağı için, buradan atıyoruz. Sebep: Loading’leri çok
yakın Factor analizinde. Yeni Factor Analysis:
29. 29 SPSS Manual
Yeni Reliability Test:
F1 F2 F3
16 2 5
15 10 4
19 21 11
18
17
(scrsht
Sığmadı
)
Rel: 0,765 Rel: 0,693 Rel:
0,655
Şimdi, sonuca yaklaşıyoruz:
Factor Name4
Factor Items5
Factor Loadings % Variance
Explained 6
Reliability
F1: Güvenilirlik S16
S15
S19
S17
S18
0,760
0,726
0,714
0,596
0,546
22,464 0,765
Duyarlılık S8
S10
S21
0,830
0,618
0,762
18,4 0,693
Somut Özellikler S5
S4
S11
0,843
0,669
0,582
18,14 0,655
TOPLAM 59,1
Burada 3 tane faktör bulduk: Güvenilirlik, duyarlılık, somut özellikler. Şimdi, bu özelliklerden
hangisinin müşteri memnuniyetini daha fazla etkilediğini bulmak istiyoruz. Bunun için, Multiple
Regression yapacağız (ilerleyen derslerde).
4
Buradaki faktör isimlerini kendimiz uydurduk sorulara bakarak
5
Buraya normalde sorular uzun uzun ve açık açık yazılır.
6
Factor analizinin Total Variance Explained’inden geliyor. % of variance sütunu.
31. 31 SPSS Manual
1: interest for cooking
14: I often try new recipes before my friends or neighbors do.
19: I love to bake and frequently do.
15: I am a good cook.
17: I love to cook.
20: My friends and neighbors often come to me for advice about food.
2: sharing opinions
7: I often seek out the advice of my friends regarding which brand of food to buy.
8: I sometimes influence what foods my friends buy.
10: I spend a lot of time talking with my friends about products and brands of food.
3: canned food consumption
25: I could not get along without canned foods.
1: I depend on canned food for at least one meal a day.
Factor Name7
Factor Items8
Factor Loadings % Variance
Explained 9
Reliability
F1: interest for
cooking
14.
19
15
17
20
0,785
0,781
0,760
0,742
0,659
29,227 0,815
F2: sharing
opinions
7
8
10
0,794
0,806
0,674
19,296 0,653
F3: canned food
consumption
25
1
0,867
0,837
15,626 0,658
TOPLAM ~66
7
Buradaki faktör isimlerini kendimiz uydurduk sorulara bakarak
8
Buraya normalde sorular uzun uzun ve açık açık yazılır.
9
Factor analizinin Total Variance Explained’inden geliyor. % of variance sütunu.
35. 35 SPSS Manual
Multiple Regression
Ornek Dataset
(BSM_200_SON)
Ornek Dataset
AFTER
Ön Hazırlıklar
BSM firması Servqual için S1-S22 sorularından oluşan bir analiz yaptırdı (Independent Variable
bunlar). Sonuçta 3 tane faktörde toplandı herşey:
1. Güvenilirlik
2. Somut özellikler
3. Duyarlılık
Başlangıç noktası, Servqual Satisfaction ilişkisini arıyordu. Bunun için M1-M4 arası memnuniyet
soruları vardı (Dependent Variable’ın soruları). Bu soruların toplandığı tek bir Total Score olmalı (=tek
bir faktör). Dependent Faktör olarak bu Total Score’u ele alacağız.
Eğer birden fazla dependent faktör olsaydı; bu işi her bir dep. Faktör için ayrı ayrı yapacaktık
(Independent’ler aynı).
Şimdi bir Correlation arıyoruz.
36. 36 SPSS Manual
Burada x = boy, y = kilo gibi düşün. X ve y arasında bir ilişki arıyorum.
Aralarında bir ilişki olduğunu görüyoruz. Ama bu ilişki, Extreme değerlerden kaynaklanıyor olabilir.
Böyle olmadığından emin olmak için şu adımları izliyoruz:
38. 38 SPSS Manual
Dikkat! Eğer Unidimensional bir yapı ile karşı karşıya isek, “Unrotated Sol.” tıkını atmamız gerekiyor.
Noktanın olduğu yerde Extreme bir değer var. Muhtemelen hatalı bir giriş yapılmış, veya araya
alakasız biri girmiş. O nokta olmasa herşey yolunda olacak. Buna “King Kong Effect” deniyor
maymunların kilolarını ölçerken araya King Kong karışmış.
Bakalım o nokta hangi satırdaymış? Çift tıklıyoruz, seçip Elements Data Label Mode diyoruz. Bize
199. kayıt olduğunu söylüyor.
39. 39 SPSS Manual
Şimdi dosyaya gidip 199. kaydın X ve Y değerlerini siliyoruz.
Şimdi Scatter’a tekrar bakıyoruz:
Veriler çok değişti gibi gözüküyor. Aslında yukarıdaki nokta çok Extreme olduğu için, Zoom Out
şekilde gösteriyordu.
40. 40 SPSS Manual
İdeal bir Scatter dağılımı, bir kare (dikdörtgen) içerisindeymiş gibi olmalıdır. < veya > şeklinde bir huni
içerisinde gibi gözüküyorsa bir problem vardır.
Şimdi Correlation’a da tekrar bakalım:
Correlation 561’e düştü! Eskiden 800 küsür idi. Bundan şunu anlıyoruz: Multiple Regression yapmaya
başlamadan önce Scatter’a bakıp Extreme (hatalı) değerleri temizlemek lazım. En baştaki 800 küsürlü
Correlation yanlış imiş. Extreme değerleri temizledikten sonra Analyse Correlate Bivariate işine
geçebiliriz. Bu işlem (Outlier temizleme işlemi), daha çok boy, kilo gibi ölçüme dayalı şeylerin yanlış
girilmesi sonucu ortaya çıkar.
Şimdi, (X Y gibi örnekler yerine) gerçek faktörlerimizin Matrix’e bakalım: (Matrix’de birden fazla
grafiği aynı anda görebiliyoruz)
42. 42 SPSS Manual
Outlier yok. Bir de cinsiyeti ekleyip bakalım (Cinsiyet’in girmemesi lazım, bilerek yanlış yapıyoruz
sonucu görelim diye):
Burada net bir biçimde görüyoruz ki, Cinsiyet gibi Nominal değerler bu tarz analizlere girmemeli.
Outlier’ları temizlediğimize göre, artık gerçek değişkenlerimizin Correlation’a bakabiliriz. İlk adımda
bile bile Cinsiyet’i de katıyoruz bakalım ne olacak?
Bu listeye önce Dependent, sonra Independent olacak şekilde ekleme yapmalıyız. Sonuç:
43. 43 SPSS Manual
Burada Cinsiyet için bir Correlation buldu. Ama saçma çünkü Nominal. Bunu ancak Scatter Plot’da
görebilirdik, burada göremiyoruz. Bu da Scatter Plot’un ikinci avantajı.
Artık Cinsiyet olmadan gerçek (doğru) Correlation’u yapabiliriz. Bu esnada ilk sırada Dependent
değişken olmalı (Memnuniyet)
44. 44 SPSS Manual
Burada 2 tane varsayımımız var:
1. Linearity: Dependent – Independent arasındaki korrelasyonu veriyor ve bunların Significantly
olması lazım. Significant olduğunu, değerlerin yanındaki **’dan anlıyoruz. ** = %99 güvenilir,
* = %95 güvenilir.
2. Multicollinearity. Mesela Güvenilirlik ve somut özellikler arasında büyük bir ilişki varsa, o ikisi
birbirine yakın faktörler demektir. Independent’ler arsındaki ilişkiler, 0,70’in daha altında
olmak zorunda. Eğer 0,70’in daha üzerinde bir oranda Correlate eden iki tane grup bulursak,
önce 1.sini, sonra 2.sini tek başına koyup denerim. Hangisi daha iyi sonuç veriyorsa, sadece o
grubu analizde tutarım.
45. 45 SPSS Manual
Regression
Regresyondaki amacımız, grafik üzerinde dağınık haldeki noktalar arasındaki en uygun doğruyu
bulmaktır. Noktaların doğruya olan uzaklıklara Error Term denir. Error Term’ler doğru dağılmıyorsa,
modelimizde bir problem vardır.
47. 47 SPSS Manual
Buradaki Sig. 0,05’den küçük olduğu için (H0’ı Reject ettiğim için), modeli kullanmaya devam
edebilirim. Şimdi geliyoruz modeldeki değişkenlere...
Formül şu: y = constant + beta1X1 + beta2X2 + ... + BetanXn
48. 48 SPSS Manual
Sig. Sütunu 0,05’den küçük olduğu için, hepsi modele girmiş. Şimdi Beta değerlerine bakacağız.
Burada en çok katkıyı Somut Özellikler (0,545) yapmış. İkinci sıradaki katkıyı Güvenilirlik (0,240)
yapmış. En son Duyarlılık yapmış.
Bir yönetici olsak, bu sonuca göre memnuniyeti arttırmak için somut özellikleri arttırmak gerekir.
Variance Inflation Factor (yukarıdaki VIF sütunu): Eğer multicol. varsa, buradaki değerler 10’dan daha
büyük olur. Mesela Somut Özellikler’in VIF’ı 16 çıksaydı, bunun (gözden kaçmış) bir başka grup ile
arasında korelasyon olduğu sonucuna varırdık.
Burada modelin açıklama gücüne bakıyoruz. Bu modelin açıklama gücü %67 imiş (Adjusted R-Square).
Eğer değişkenlerden biri significant çıkmasaydı, geriye dönerek o değişkeni analizden çıkartacaktık.
Burada güzel bir kısayol var:
49. 49 SPSS Manual
Burada Stepwise seçmiş olsaydık, bizim için adım adım otomatik en iyi modeli kurup seçecekti. Bizim
durumumuzda zaten doğru bir analiz yaptığımız için aynı sonuçlar çıkacaktır.
50. 50 SPSS Manual
Yorum
1. Güvenilirlik Memnuniyet: (B= 0,240)
2. Duyarlılık Memnuniyet (B=0,594)
3. Somut Özellikler Memnuniyet (B=0,545)
4. R Square = 0,678
Örnek Conclusion
Aim of this research was to determine the dimensions of perceived E-Service quality in Turkish
commerce websites; especially www.hepsiburada.com . According to the results of the analysis, the
most significant factors to effect customer loyalty are the following: “Correction policy of the website
and options to return” (β=0,282 ; t=7,079 ; sig.=0), “Ease of use” (β=0,235 ; t=6,129 ; sig.=0),
“Keeping promises of delivery” (β=0,207 ; t=5,721 ; sig.=0).
(Yukarıda, parantez içindeki değerler hep Multiple Regression’dan geliyor)
Although not that effective; other important factors to effect loyalty are: “Shopping pleasure”
(β=0,148 ; t=4,685 ; sig.=0), “Options of communication and live support” (β=0,117 ; t=3,282 ; sig.=
0,001), “Presence of alternative products and comparison options” (β=0,108 ; t=3,071 ; sig.= 0,002).
It is significant that none of the risk factors seem to affect loyalty. Apparently, visitors of
hepsiburada.com don’t worry about online safety. That’s probably because its customers trust the
website. It is also possible that many people are not aware of online risks. Factors of all other groups
(Servqual, Recovery, Benefits) are present.
The only significant result of the Anova test is; that loyalty varies according to the level of education.
Primary school graduates seem to differ from high school, university and master graduates in terms
51. 51 SPSS Manual
of loyalty. The most loyal people are master graduates; who are followed by university and
highschool graduates.