ݺߣ

ݺߣShare a Scribd company logo
BÖLÜM 1: Temel Kavramlar
İSTATİSTİK
İstatistik Nedir?
 İstatistik, belirsizliğin veya eksik bilginin söz konusu
olduğu durumlarda çıkarımlar yapmak ve karar
vermek için sayısal verilerin toplanması, analizi ve
kullanılmasını içeren bir disiplindir. İstatistik bir çok
bilim dalının kullandığı bir araçtır.
 İstatistik doğal olarak görülen değişkenlik üzerine
vurgu yapar
Değişkenler
 Bir nesnenin özelliklerini ölçtüğümüz zaman,
nesneden nesneye fark eden bir değer elde
ederiz. Örneğin bu sınıftaki kişileri nesne ve kişilerin
boylarını onların özelliği olarak düşünebiliriz
 Boy özelliği nesneden nesneye değişim gösterir. Bu
özelliğinden dolayı da değişken olarak adlandırılır.
Veri Türleri (Veri Ölçüm Düzeyleri)
 Değişkenler 4 farklı ölçüm seviyesinde ölçülebilirler
 Bu farklı ölçüm düzeylerini bilmeniz ve anlamanız
oldukça önemlidir.
1. Nominal - Kategorik
 Veriler bir yada daha fazla kategoriye göre
sınıflandırılarak ölçüldükleri zaman, veri nominal
seviyede ölçülmüş demektir.
 Ör: Renk, Cinsiyet, Dini ve politik tercihler, vs.
2. Sıralı (Ordinal)
 Ölçümün farklı kategorileri arasında bir sıra
(öncelik) durumu var ancak sıralar arasındaki
mesafe eşit veya ölçülebilir değilse, ölçüm
seviyesi sıralıdır.
 Ör: Eğitim durumu, askeri rütbe, elbise
büyüklüğü, vs.
 Kategoriler arasıda bir sıra farkı vardır ancak
bu farkın büyüklüğü belirli değildir.
3. Aralık (Interval)
 Ölçüm değerleri arasında büyüklük olarak ölçülen
bir farklılık var ancak mutlak bir sıfır noktası yoksa,
ölçüm seviyesi aralık seviyesindedir.
 Hava sıcaklığı en iyi örnektir.
4. Oran (Ratio)
 Veriler arasındaki fark sayısal olarak belirli ve
mutlak bir sıfır noktası var ise, ölçüm seviyesi oran
olarak adlandırılır.
 Ör: Ağırlık, yaş, boy, vs.
İstatistik Türleri
 Tanımlayıcı (descriptive) İstatistik
 Verileri toplama, sunma ve açıklama
 Çıkarımsal (inferential) İstatistik
 Örneklem verilerine dayalı olarak ana kütle
hakkında çıkarımlar yapma veya karar verme
Tanımlayıcı İstatistik
 Veri Toplama
 Ör: Anket, Gözlem, Deney
 Verileri Sunma
 Ör: Grafikler
 Veri Özelliklerini Belirleme
 Ör: Ortalama =
n
xi
Çıkarımsal İstatistik
 Örneklem (sample) sonuçlarına bakarak ana kütle
(population) hakkında yorumlarda bulunmak
Örneklem istatistikleri Ana kütle parametreleri
(biliniyor) Çıkarım (bilinmiyor, ancak
örnekleme bakılarak
tahmin edilebilir)
Sample
Population
Çıkarımsal İstatistik
 Bir ana kütle hakkında örneklem sonuçlarına dayalı olarak
çıkarımlarda bulunmak veya karar vermek.
 Tahmin
 Ör: Ana kütledeki ortalama ağırlığı örneklem ortalama
ağırlığını kullanarak tahmin etmek
 Hipotez Testi
 Ör: Örneklem verilerine dayalı olarak ana kütle ortalama
ağırlığının 60 kg. olduğu iddiasını test etmek
Örneklem Alma
 Bilimsel araştırmalarda çoğu zaman bir örneklem
üzerinden toplanan veriler kullanılarak analizler
yapar ve çıkarımlarda bulunuruz. Araştırma
sonuçlarının geçerliliği bu örneklemin ana kütleyi
temsil gücüne bağlıdır. Bu nedenle örneklemin ana
kütleyi temsil etmesi oldukça önemlidir.
 Bir örnekleme dayalı olarak yapılan çıkarımların
kalitesi hem örnekleme yöntemi hem de örneklemin
büyüklüğü ile ilişkilidir. Dolayısıyla uygun yöntem ve
büyüklükte örneklem oluşturmak oldukça önemlidir.
Örneklem Alma…
 Ana kütle araştırmanın ilgilendiği kişi, nesne veya olayların
bütününe verilen isimdir. Eğer bir çalışmada ana kütlenin
tümünden veri toplanırsa buna tamsayım denir.
 Örneklem bir ana kütleden seçilen elemanların oluşturduğu
kümedir.
 Örneklem almamıza neden olan şey ana kütlenin tümü
hakkında veri toplamanın gerektirdiği çaba, zaman ve
maliyetin yüksek oluşu veya bazen imkansız oluşudur.
 Örneklem almanın amacı ise yukarıdaki sayılan nedenlerle
tüm verileri ölçülemeyen ana kütle hakkında ondan seçilen
örneklemden edinilen bilgilere dayalı olarak çıkarımlarda
bulunmaktır.
Örneklem Alma…
 Ana kütle parametresi: Ana kütlenin herhangi bir
özelliği. Yunan harfleri ve büyük harfler ile gösterilir
(N,µ)
 Örneklem istatistiği: Örneklemin ölçülen bir özelliği.
Latin harfleri ve küçük harfler ile gösterilir (n,s)
 Örneklem Hatası: Genellikle araştırmalarda tamsayım
yapılıp ana kütle parametresi hesaplanmaz. Ancak ana
kütleden seçilen bir örneklemin istatistiği hesaplanır ve
bu istatistiğe dayalı olarak ana kütle parametresi
tahmin edilmeye çalışılır. Tamsayım yerine örneklem
alındığı için oluşan hata örneklem hatası olarak
adlandırılır.
Örneklem Alma…
 Örneklem çerçevesi: Örnekleme girebilecek bütün
birimleri içeren liste (seçmen kütükleri, bir şirketteki
işçi kayıtları, öğrenci işleri veritabanı, vb.)
Örneklem alma yöntemleri
 Örneklem alma yöntemleri tesadüfi olan ve olmayan olmak üzere iki ana grupta
toplanabilir. Tesadüfi olan yöntemlerde bütün birimlerin örnekleme girme şansı
varken tesadüfi olmayan yöntemlerde bu durum söz konusu değildir. Aşağıda her iki
gruba giren temel yöntemler verilmiştir
1. Tesadüfi (rassal, random) örnekleme yöntemleri
a. Basit rassal
b. Sistematik
c. Tabakalı
d. Küme
2. Tesadüfi olmayan (non-random) örnekleme yöntemleri
a. Kolayda
b. Yargısal
c. Kota
d. Kartopu
Basit rassal örnekleme
 Her birimin örnekleme girme şansı eşittir.
 Torbadan isimleri seçme yerine günümüzde rastsal
sayı üreten bilgisayar yazılımları kullanılıyor.
Sistematik Örnekleme
 Seçilecek örneklem büyüklüğünü belirle (n)
 G = N / n
 1 ile G arasından rastgele bir sayı seç (X)
 X, G+X, 2G+X… elemanları seç
N = 64
n = 8
k = 8
1. grup
Tabakalı örnekleme
 Basit rassal örneklemede yeterince büyüklükte bir örneklem oluşturulmazsa,
ana kütledeki bütün gruplar alınan örneklem içinde yeterince temsil
edilmeyebilir. Bu nedenle ana kütle önemli özelliklere göre gruplara
(tabakalara) ayrılıp her grubu temsil edecek tabakalardan seçme yapılır.
Amaç daha az bir maliyetle daha temsili bir örneklem oluşturmaktır.
 Öncelikle ana kütle tabakalara ayrılır. Her tabakadan rastsal bir şekilde
örneklem seçilir.
 Tabakaları oluşturmak zor olabilir.
Ana kütle 4
tabakaya
bölünmüş
Örneklem
Küme Örneklemesi
 Ana kütlenin zaman veya mekan açısından dağınık olduğu ve
bu nedenle örneklemenin maliyetli olacağı durumlarda
örnekleme işinin belirli kümelerden (ör: bölgelerden) rassal bir
şekilde yapılmasıdır.
 Örneğin bir şehirdeki ilköğretim öğrencileri ile ilgili yapılacak
bir çalışmada bütün ilköğretim okullarını çalışmaya dahil etmek
yerine belirli semtlerdeki ilköğretim okullarından rastgele
örneklem almak küme örneklemesidir.
Ana kütle 16
kümeye ayrılmış
Bu kümelerden
rastgele bir kısmı
seçiliyor
Kolayda (fırsat) örneklemesi
 Araştırmacının kolaylıkla ulaşabildiği birimlerden
veri toplamasıdır. Örneğin üniversite öğrencileri
hakkında araştırma yapan bir araştırmacının
üniversite karşılaştığı ilk150 öğrenci ile anket
yapması gibi
 Kolaydır ancak elde edilen sonuçlar
genelleştirilemez
Yargısal örnekleme
 Araştırmacının araştırma örneklemi belirlerken bir
yargıya göre hareket ederek örneklem
oluşturmasıdır. Örneğin öğretim üyelerinin sorunları
hakkında araştırma yaparken konuyu en iyi
profesörlerin bileceğinin düşünerek sadece onları
örnekleme dahil eden bir araştırmacı yargısal bir
örnekleme oluşturmuş olur.
Kota örneklemesi
 Tabakalı örneklemede olduğu gibi ana kütle
gruplara ayrılır. Daha sonra örneklem büyüklüğüne
bağlı olarak her gruptan ne kadar (kota) örneklem
seçileceğine karar verilir. Grup kotaları
dolduruluncaya kadar veri toplanır. Bu verilerin
tesadüfi olarak toplanmasına bakılmaz sadece kota
doldurulmaya çalışılır.
Kartopu örneklemesi
 Örneklem çerçevesinin oluşturulmasının mümkün veya
çok zor olduğu durumlarda kullanılır. Örneğin
madde bağımlı çocuklarla ilgili yapılan bir
çalışmada madde bağımlısı bir veya birkaç
çocuktan veri toplanır. Daha sonra bunların tanıdığı
başka madde bağımlısı çocuk bulunur ve onlardan
veri toplanır. Böylece veri kümesi kartopu gibi
büyüyerek örneklem oluşturulmuş olur.

More Related Content

İstatistik Temel Kavramlar

  • 1. BÖLÜM 1: Temel Kavramlar İSTATİSTİK
  • 2. İstatistik Nedir?  İstatistik, belirsizliğin veya eksik bilginin söz konusu olduğu durumlarda çıkarımlar yapmak ve karar vermek için sayısal verilerin toplanması, analizi ve kullanılmasını içeren bir disiplindir. İstatistik bir çok bilim dalının kullandığı bir araçtır.  İstatistik doğal olarak görülen değişkenlik üzerine vurgu yapar
  • 3. Değişkenler  Bir nesnenin özelliklerini ölçtüğümüz zaman, nesneden nesneye fark eden bir değer elde ederiz. Örneğin bu sınıftaki kişileri nesne ve kişilerin boylarını onların özelliği olarak düşünebiliriz  Boy özelliği nesneden nesneye değişim gösterir. Bu özelliğinden dolayı da değişken olarak adlandırılır.
  • 4. Veri Türleri (Veri Ölçüm Düzeyleri)  Değişkenler 4 farklı ölçüm seviyesinde ölçülebilirler  Bu farklı ölçüm düzeylerini bilmeniz ve anlamanız oldukça önemlidir.
  • 5. 1. Nominal - Kategorik  Veriler bir yada daha fazla kategoriye göre sınıflandırılarak ölçüldükleri zaman, veri nominal seviyede ölçülmüş demektir.  Ör: Renk, Cinsiyet, Dini ve politik tercihler, vs.
  • 6. 2. Sıralı (Ordinal)  Ölçümün farklı kategorileri arasında bir sıra (öncelik) durumu var ancak sıralar arasındaki mesafe eşit veya ölçülebilir değilse, ölçüm seviyesi sıralıdır.  Ör: Eğitim durumu, askeri rütbe, elbise büyüklüğü, vs.  Kategoriler arasıda bir sıra farkı vardır ancak bu farkın büyüklüğü belirli değildir.
  • 7. 3. Aralık (Interval)  Ölçüm değerleri arasında büyüklük olarak ölçülen bir farklılık var ancak mutlak bir sıfır noktası yoksa, ölçüm seviyesi aralık seviyesindedir.  Hava sıcaklığı en iyi örnektir.
  • 8. 4. Oran (Ratio)  Veriler arasındaki fark sayısal olarak belirli ve mutlak bir sıfır noktası var ise, ölçüm seviyesi oran olarak adlandırılır.  Ör: Ağırlık, yaş, boy, vs.
  • 9. İstatistik Türleri  Tanımlayıcı (descriptive) İstatistik  Verileri toplama, sunma ve açıklama  Çıkarımsal (inferential) İstatistik  Örneklem verilerine dayalı olarak ana kütle hakkında çıkarımlar yapma veya karar verme
  • 10. Tanımlayıcı İstatistik  Veri Toplama  Ör: Anket, Gözlem, Deney  Verileri Sunma  Ör: Grafikler  Veri Özelliklerini Belirleme  Ör: Ortalama = n xi
  • 11. Çıkarımsal İstatistik  Örneklem (sample) sonuçlarına bakarak ana kütle (population) hakkında yorumlarda bulunmak Örneklem istatistikleri Ana kütle parametreleri (biliniyor) Çıkarım (bilinmiyor, ancak örnekleme bakılarak tahmin edilebilir) Sample Population
  • 12. Çıkarımsal İstatistik  Bir ana kütle hakkında örneklem sonuçlarına dayalı olarak çıkarımlarda bulunmak veya karar vermek.  Tahmin  Ör: Ana kütledeki ortalama ağırlığı örneklem ortalama ağırlığını kullanarak tahmin etmek  Hipotez Testi  Ör: Örneklem verilerine dayalı olarak ana kütle ortalama ağırlığının 60 kg. olduğu iddiasını test etmek
  • 13. Örneklem Alma  Bilimsel araştırmalarda çoğu zaman bir örneklem üzerinden toplanan veriler kullanılarak analizler yapar ve çıkarımlarda bulunuruz. Araştırma sonuçlarının geçerliliği bu örneklemin ana kütleyi temsil gücüne bağlıdır. Bu nedenle örneklemin ana kütleyi temsil etmesi oldukça önemlidir.  Bir örnekleme dayalı olarak yapılan çıkarımların kalitesi hem örnekleme yöntemi hem de örneklemin büyüklüğü ile ilişkilidir. Dolayısıyla uygun yöntem ve büyüklükte örneklem oluşturmak oldukça önemlidir.
  • 14. Örneklem Alma…  Ana kütle araştırmanın ilgilendiği kişi, nesne veya olayların bütününe verilen isimdir. Eğer bir çalışmada ana kütlenin tümünden veri toplanırsa buna tamsayım denir.  Örneklem bir ana kütleden seçilen elemanların oluşturduğu kümedir.  Örneklem almamıza neden olan şey ana kütlenin tümü hakkında veri toplamanın gerektirdiği çaba, zaman ve maliyetin yüksek oluşu veya bazen imkansız oluşudur.  Örneklem almanın amacı ise yukarıdaki sayılan nedenlerle tüm verileri ölçülemeyen ana kütle hakkında ondan seçilen örneklemden edinilen bilgilere dayalı olarak çıkarımlarda bulunmaktır.
  • 15. Örneklem Alma…  Ana kütle parametresi: Ana kütlenin herhangi bir özelliği. Yunan harfleri ve büyük harfler ile gösterilir (N,µ)  Örneklem istatistiği: Örneklemin ölçülen bir özelliği. Latin harfleri ve küçük harfler ile gösterilir (n,s)  Örneklem Hatası: Genellikle araştırmalarda tamsayım yapılıp ana kütle parametresi hesaplanmaz. Ancak ana kütleden seçilen bir örneklemin istatistiği hesaplanır ve bu istatistiğe dayalı olarak ana kütle parametresi tahmin edilmeye çalışılır. Tamsayım yerine örneklem alındığı için oluşan hata örneklem hatası olarak adlandırılır.
  • 16. Örneklem Alma…  Örneklem çerçevesi: Örnekleme girebilecek bütün birimleri içeren liste (seçmen kütükleri, bir şirketteki işçi kayıtları, öğrenci işleri veritabanı, vb.)
  • 17. Örneklem alma yöntemleri  Örneklem alma yöntemleri tesadüfi olan ve olmayan olmak üzere iki ana grupta toplanabilir. Tesadüfi olan yöntemlerde bütün birimlerin örnekleme girme şansı varken tesadüfi olmayan yöntemlerde bu durum söz konusu değildir. Aşağıda her iki gruba giren temel yöntemler verilmiştir 1. Tesadüfi (rassal, random) örnekleme yöntemleri a. Basit rassal b. Sistematik c. Tabakalı d. Küme 2. Tesadüfi olmayan (non-random) örnekleme yöntemleri a. Kolayda b. Yargısal c. Kota d. Kartopu
  • 18. Basit rassal örnekleme  Her birimin örnekleme girme şansı eşittir.  Torbadan isimleri seçme yerine günümüzde rastsal sayı üreten bilgisayar yazılımları kullanılıyor.
  • 19. Sistematik Örnekleme  Seçilecek örneklem büyüklüğünü belirle (n)  G = N / n  1 ile G arasından rastgele bir sayı seç (X)  X, G+X, 2G+X… elemanları seç N = 64 n = 8 k = 8 1. grup
  • 20. Tabakalı örnekleme  Basit rassal örneklemede yeterince büyüklükte bir örneklem oluşturulmazsa, ana kütledeki bütün gruplar alınan örneklem içinde yeterince temsil edilmeyebilir. Bu nedenle ana kütle önemli özelliklere göre gruplara (tabakalara) ayrılıp her grubu temsil edecek tabakalardan seçme yapılır. Amaç daha az bir maliyetle daha temsili bir örneklem oluşturmaktır.  Öncelikle ana kütle tabakalara ayrılır. Her tabakadan rastsal bir şekilde örneklem seçilir.  Tabakaları oluşturmak zor olabilir. Ana kütle 4 tabakaya bölünmüş Örneklem
  • 21. Küme Örneklemesi  Ana kütlenin zaman veya mekan açısından dağınık olduğu ve bu nedenle örneklemenin maliyetli olacağı durumlarda örnekleme işinin belirli kümelerden (ör: bölgelerden) rassal bir şekilde yapılmasıdır.  Örneğin bir şehirdeki ilköğretim öğrencileri ile ilgili yapılacak bir çalışmada bütün ilköğretim okullarını çalışmaya dahil etmek yerine belirli semtlerdeki ilköğretim okullarından rastgele örneklem almak küme örneklemesidir. Ana kütle 16 kümeye ayrılmış Bu kümelerden rastgele bir kısmı seçiliyor
  • 22. Kolayda (fırsat) örneklemesi  Araştırmacının kolaylıkla ulaşabildiği birimlerden veri toplamasıdır. Örneğin üniversite öğrencileri hakkında araştırma yapan bir araştırmacının üniversite karşılaştığı ilk150 öğrenci ile anket yapması gibi  Kolaydır ancak elde edilen sonuçlar genelleştirilemez
  • 23. Yargısal örnekleme  Araştırmacının araştırma örneklemi belirlerken bir yargıya göre hareket ederek örneklem oluşturmasıdır. Örneğin öğretim üyelerinin sorunları hakkında araştırma yaparken konuyu en iyi profesörlerin bileceğinin düşünerek sadece onları örnekleme dahil eden bir araştırmacı yargısal bir örnekleme oluşturmuş olur.
  • 24. Kota örneklemesi  Tabakalı örneklemede olduğu gibi ana kütle gruplara ayrılır. Daha sonra örneklem büyüklüğüne bağlı olarak her gruptan ne kadar (kota) örneklem seçileceğine karar verilir. Grup kotaları dolduruluncaya kadar veri toplanır. Bu verilerin tesadüfi olarak toplanmasına bakılmaz sadece kota doldurulmaya çalışılır.
  • 25. Kartopu örneklemesi  Örneklem çerçevesinin oluşturulmasının mümkün veya çok zor olduğu durumlarda kullanılır. Örneğin madde bağımlı çocuklarla ilgili yapılan bir çalışmada madde bağımlısı bir veya birkaç çocuktan veri toplanır. Daha sonra bunların tanıdığı başka madde bağımlısı çocuk bulunur ve onlardan veri toplanır. Böylece veri kümesi kartopu gibi büyüyerek örneklem oluşturulmuş olur.