ݺߣ

ݺߣShare a Scribd company logo
Tilastollisen kuvauksen perusteet
• Kurssin keskeinen teoria
• 7.9.2011 ope: Jukka Törnroos
TILASTOLLISEN KUVAUKSEN
PERUSTEET SANASTOA
• Alakvartiili: Raja, jonka alle jää 25 % havainnoista. Rautalankamalli
tämän määrittämiseksi:
1) Laita havainnot suuruusjärjestykseen ja määritä sitten mediaani
(havaintojen keskikohta)
2) Jaa havainnot mediaanin avulla suuriin (suurempia kuin mediaani)
ja pieniin (pienempiä kuin mediaani) ja määritä sitten pienien lukujen
mediaani, joka on sama kuin alakvartiili.
• Keskiarvo: Yleensä tällä tarkoitetaan havaintojen summaa jaettuna
havaintojen lukumäärällä. (Jos on käytetty jotain muuta laskutapaa,
tämä kannattaa kertoa.) On yksi tavallisimmin käytetyistä
tilastollisista tunnusluvuista.
TILASTOLLISEN KUVAUKSEN
PERUSTEET SANASTOA
• Keskihajonta: Kuvaa sitä, miten laajalle alueelle havainnot
jakautuvat keskiarvon ympärille. Tarkemmin sanottuna arvo kertoo
sen, kuinka kaukana keskiarvosta havainnot keskimäärin sijaitsevat.
• Kumulatiivinen frekvenssi /prosenttiosuus: Tästä käytetään
myös nimitystä summafrekvenssi, tai –prosentti. Kuvaa sitä, kuinka
monta havaintoa tai prosenttia havainnoista kuuluu yhteensä kyseessä
olevaan ja sitä edeltäviin luokkiin, kun havainnot on luokiteltu.
• Mediaani: Tarkoittaa suuruusjärjestykseen laitettujen havaintojen
keskikohtaa. Jos havaintoja on pariton määrä, tämä on joukon
keskimmäisenä oleva arvo. Jos havaintoja on parillinen määrä,
mediaani on kahden keskimmäisen arvon keskiarvo.
TILASTOLLISEN KUVAUKSEN
PERUSTEET SANASTOA
• Yläkvartiili Raja, jonka alle jää 75 % havainnoista. Voidaan
määritellä vastaavasti kuin alakvartiili käyttäen mediaania suurempien
havaintojen joukkoa.
Opettaja: Jukka Törnroos
Tilastomatematiikkaa ja vähän
muuta
• Normaalijakauma
• Keskiluvut (aritmeettinen ja painotettu
keskiarvo, mediaani, moodi)
• sijaintilukuja: fraktiileja ( kvartiilit, desiilit,
persentiilit)
• Tilastollisten muuttujien mitta-asteikot
Opettaja: Jukka Törnroos
Alkuverryttelyä (1)
• Tilastokurssin osallistujia on 20 ja
heidän keskipituudekseen saatiin 167
cm. Mikä oli heidän todellinen
keskipituutensa, kun huomattiin, että
yhden osallistujan pituus oli kirjattu
väärin 18 cm liian pitkäksi?
Opettaja: Jukka Törnroos
Alkuverryttelyä (2)
• Tilastokurssilla oli 23 nais- ja 2
miesossallistujaa. Kuinka suuri
prosenttiosuus osallistujista oli miehiä ja
kuinka suuri prosenttiosuus oli naisia?
Normaalijakaumahttp://www2.amk.fi/mater/tutkimusmenetelmat/kvantitat
/Normaalijakauma.htm
Opettaja: Jukka Törnroos
Normaalijakauma
• Määritellään matemaattisesti kahden
tunnusluvun avulla: Keskiarvon μ ja
keskihajonnan σ (luku, joka kuvaa
havaintojen ryhmittymistä keskiarvon
ympärille) avulla: esim. N (0, 1) tarkoittaa
normaalijakaumaa keskiarvolla 0 ja
keskihajonnalla 1.
Opettaja: Jukka Törnroos
Normaalijakauma
• Jos tiedetään, että aineisto noudattaa
normaalijakaumaa, havainnoista noin 68,3 %
sijaitsee välillä (μ - σ) -- (μ + σ) ja noin 95,4 %
välillä(μ - 2σ) -- (μ + 2σ)
Opettaja: Jukka Törnroos
2011 pituusjakauma
140
145
150
155
160
165
170
175
180
185
190
195
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Sarja1
Keskiarvo=170,4 cm
keskihajonta= 7,2 cm
Opettaja: Jukka Törnroos
(Tilasto)matematiikkaa
• Tilastolliset tunnusluvut:
• Aritmeettinen keskiarvo:
• Aritmeettista keskiarvoa käytetään, jos
käytössä ei ole painokertoimia!
n
x
n
i
i
x
∑
= =1
_
Opettaja: Jukka Törnroos
(Tilastomatikkaa)
• Painotettu keskiarvo:
– Yleensä tilastollisten
tutkimusten tuloksia
pyritään tarkentamaan
painokertoimilla:
– Korjataan otoksen mahdollisia vinoutumia esim.,
jos miesten ja naisten suhde poikkeaa
teoreettisesta (”normaali” 50:50??)
∑
∑
=
=
=
n
i
i
n
i
i
a
ax
x
1
1
_
Opettaja: Jukka Törnroos
Keskilukuja
• Keskiarvoa käytetään yleisimmin, mutta aina
se ei sovi (riippuu jakauman ominaisuuksista
ja käytetystä mitta-asteikosta
• Mediaani: Arvo, joka jakaa havainnot kahteen
yhtä suureen osaan.
• Moodi: Tyyppiarvo, eli yleisin havaintoarvo
(voi olla useita!)
Opettaja: Jukka Törnroos
(Tilastomatikkaa)
Jakauman kuvailua:
• Sijaintilukuja:
• Persentiili: luku, jonka alle jää esim. 95 %
havaintoarvoista (=95. Persentiili) Vastaavasti
esim. 5. Persentiili on arvo, jonka alle jää 5 %
havainnoista.
• Desiilit jakavat havaintojoukon kymmeneen
yhtä suureen ”viipaleeseen”. =Samat kuin
10., 20., 30.,…80. Ja 90. persentiilit
Opettaja: Jukka Törnroos
• Sijaintilukuja:
• Kvartiilit: luvut, jotka jakavat havainnot
neljänneksiin. 25%, 50% (mediaani!!), 75 %.
Alin neljännes =alle 25 prosentin rajan olevat
havainnot = alakvartiili, ylin neljännes = yli 75
prosentin rajan olevat havainnot = yläkvartiili.
(Tilastomatikkaa)
Jakauman kuvailua:
Opettaja: Jukka Törnroos
• Hajontalukuja:
• Vaihteluväli= minimiarvo -- maksimiarvo ja
vaihteluvälin pituus = maksimi-minimi.
• Keskihajonta otokselle:
1
)(
1
2
_
−
−
=
∑=
n
xx
s
n
i
i
(Tilastomatikkaa)
Jakauman kuvailua:
Opettaja: Jukka Törnroos
• Hajontalukuja:
• Vaihteluväli= minimiarvo -- maksimiarvo ja
vaihteluvälin pituus = maksimi-minimi.
• Keskihajonta otokselle:
• Varianssi =
keskihajonta
potenssiin 2
1
)(
1
2
_
−
−
=
∑=
n
xx
s
n
i
i
(Tilastomatikkaa)
Jakauman kuvailua:
Opettaja: Jukka Törnroos
• Hajontalukuja:
• Keskiarvon keskivirhe:
• Keskiarvon ka 95 % luottamusväli on
ka - 1,96*S -- ka + 1,96*S
n
s
S =
(Tilastomatikkaa)
Jakauman kuvailua:
Keskiarvo??• 2 3 4 5 3 (kurssien laajuus)
• 1 4 5 4 3 (arvosanat)
• Laske kurssiarvosanojen keskiarvo ja kurssien laajudella
painotettu keskiarvo.
• Laske kurssiarvosanojen keskihajonta!
• Kaavan selittelyä: Ensin lasketaan jokaiselle
havaintoarvolle x_i erotus havaintoarvo-keskiarvo
(kaavan jälkimmäinen x),
• Sitten korotetaan erotukset
• Toiseen potenssiin ja
• Lasketaan nämä toiset
• Potenssit yhteen. Tämä
• Summa jaetaan n -1:llä (eli
• Havaintojen lukumäärällä -1).
• Lopuksi sitten vielä otetaan neliöjuuri edellä saadusta
1
)(
1
2
_
−
−
=
∑=
n
xx
s
n
i
i
Muuttujien mitta-asteikot:
• Erilaisia tietoja voidaan käsitellä eri
tavoilla: käsittely riippuu ilmiön ja
kysymyksen mahdollistamasta mitta-
asteikosta.
Opettaja: Jukka Törnroos
• Tilastollisten muuttujien käsittelyssä
käytetyt mitta-asteikot jaetaan yleensä 4
pääluokkaan:
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot:
1) Nominaali- eli luokitteluasteikko:
Havainnot voidaan luokitella johonkin
ryhmään. Esim. värien tai muodon mukaan
luokittelu.
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot:
2) Ordinaali- eli järjestysasteikko
Ryhmät voidaan järjestää mitatun asian
suhteen. Esim. armeijan upseereiden
arvojärjestys.
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot:
3) Intervalli- eli välimatka-asteikko:
Havaintojen välinen erotus voidaan laskea.
Siis välimatka tunnetaan aina. Ei
välttämättä kuitenkaan keskiarvoa! Esim.
Lämpötilan Fahrenheit- ja Celsius-asteet. Ei
ole kiinteää nollakohtaa!
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot:
4) Absoluuttinen asteikko eli suhdeasteikko.
Asteikolla on yksikäsitteinen nollapiste,
jolloin voidaan laskea havaintojen välisiä
suhteita (osamääriä). Esim. ikä, pituus,
massa,…
• Mitta-asteikoista löytyy runsaasti
materiaalia Internetistä, esimerkiksi
Tilastokeskuksen Verkkokoulusta.
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot:

More Related Content

Törrösen tilastoperusjuttuja

  • 1. Tilastollisen kuvauksen perusteet • Kurssin keskeinen teoria • 7.9.2011 ope: Jukka Törnroos
  • 2. TILASTOLLISEN KUVAUKSEN PERUSTEET SANASTOA • Alakvartiili: Raja, jonka alle jää 25 % havainnoista. Rautalankamalli tämän määrittämiseksi: 1) Laita havainnot suuruusjärjestykseen ja määritä sitten mediaani (havaintojen keskikohta) 2) Jaa havainnot mediaanin avulla suuriin (suurempia kuin mediaani) ja pieniin (pienempiä kuin mediaani) ja määritä sitten pienien lukujen mediaani, joka on sama kuin alakvartiili. • Keskiarvo: Yleensä tällä tarkoitetaan havaintojen summaa jaettuna havaintojen lukumäärällä. (Jos on käytetty jotain muuta laskutapaa, tämä kannattaa kertoa.) On yksi tavallisimmin käytetyistä tilastollisista tunnusluvuista.
  • 3. TILASTOLLISEN KUVAUKSEN PERUSTEET SANASTOA • Keskihajonta: Kuvaa sitä, miten laajalle alueelle havainnot jakautuvat keskiarvon ympärille. Tarkemmin sanottuna arvo kertoo sen, kuinka kaukana keskiarvosta havainnot keskimäärin sijaitsevat. • Kumulatiivinen frekvenssi /prosenttiosuus: Tästä käytetään myös nimitystä summafrekvenssi, tai –prosentti. Kuvaa sitä, kuinka monta havaintoa tai prosenttia havainnoista kuuluu yhteensä kyseessä olevaan ja sitä edeltäviin luokkiin, kun havainnot on luokiteltu. • Mediaani: Tarkoittaa suuruusjärjestykseen laitettujen havaintojen keskikohtaa. Jos havaintoja on pariton määrä, tämä on joukon keskimmäisenä oleva arvo. Jos havaintoja on parillinen määrä, mediaani on kahden keskimmäisen arvon keskiarvo.
  • 4. TILASTOLLISEN KUVAUKSEN PERUSTEET SANASTOA • Yläkvartiili Raja, jonka alle jää 75 % havainnoista. Voidaan määritellä vastaavasti kuin alakvartiili käyttäen mediaania suurempien havaintojen joukkoa.
  • 5. Opettaja: Jukka Törnroos Tilastomatematiikkaa ja vähän muuta • Normaalijakauma • Keskiluvut (aritmeettinen ja painotettu keskiarvo, mediaani, moodi) • sijaintilukuja: fraktiileja ( kvartiilit, desiilit, persentiilit) • Tilastollisten muuttujien mitta-asteikot
  • 6. Opettaja: Jukka Törnroos Alkuverryttelyä (1) • Tilastokurssin osallistujia on 20 ja heidän keskipituudekseen saatiin 167 cm. Mikä oli heidän todellinen keskipituutensa, kun huomattiin, että yhden osallistujan pituus oli kirjattu väärin 18 cm liian pitkäksi?
  • 7. Opettaja: Jukka Törnroos Alkuverryttelyä (2) • Tilastokurssilla oli 23 nais- ja 2 miesossallistujaa. Kuinka suuri prosenttiosuus osallistujista oli miehiä ja kuinka suuri prosenttiosuus oli naisia?
  • 9. Opettaja: Jukka Törnroos Normaalijakauma • Määritellään matemaattisesti kahden tunnusluvun avulla: Keskiarvon μ ja keskihajonnan σ (luku, joka kuvaa havaintojen ryhmittymistä keskiarvon ympärille) avulla: esim. N (0, 1) tarkoittaa normaalijakaumaa keskiarvolla 0 ja keskihajonnalla 1.
  • 10. Opettaja: Jukka Törnroos Normaalijakauma • Jos tiedetään, että aineisto noudattaa normaalijakaumaa, havainnoista noin 68,3 % sijaitsee välillä (μ - σ) -- (μ + σ) ja noin 95,4 % välillä(μ - 2σ) -- (μ + 2σ)
  • 11. Opettaja: Jukka Törnroos 2011 pituusjakauma 140 145 150 155 160 165 170 175 180 185 190 195 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Sarja1 Keskiarvo=170,4 cm keskihajonta= 7,2 cm
  • 12. Opettaja: Jukka Törnroos (Tilasto)matematiikkaa • Tilastolliset tunnusluvut: • Aritmeettinen keskiarvo: • Aritmeettista keskiarvoa käytetään, jos käytössä ei ole painokertoimia! n x n i i x ∑ = =1 _
  • 13. Opettaja: Jukka Törnroos (Tilastomatikkaa) • Painotettu keskiarvo: – Yleensä tilastollisten tutkimusten tuloksia pyritään tarkentamaan painokertoimilla: – Korjataan otoksen mahdollisia vinoutumia esim., jos miesten ja naisten suhde poikkeaa teoreettisesta (”normaali” 50:50??) ∑ ∑ = = = n i i n i i a ax x 1 1 _
  • 14. Opettaja: Jukka Törnroos Keskilukuja • Keskiarvoa käytetään yleisimmin, mutta aina se ei sovi (riippuu jakauman ominaisuuksista ja käytetystä mitta-asteikosta • Mediaani: Arvo, joka jakaa havainnot kahteen yhtä suureen osaan. • Moodi: Tyyppiarvo, eli yleisin havaintoarvo (voi olla useita!)
  • 15. Opettaja: Jukka Törnroos (Tilastomatikkaa) Jakauman kuvailua: • Sijaintilukuja: • Persentiili: luku, jonka alle jää esim. 95 % havaintoarvoista (=95. Persentiili) Vastaavasti esim. 5. Persentiili on arvo, jonka alle jää 5 % havainnoista. • Desiilit jakavat havaintojoukon kymmeneen yhtä suureen ”viipaleeseen”. =Samat kuin 10., 20., 30.,…80. Ja 90. persentiilit
  • 16. Opettaja: Jukka Törnroos • Sijaintilukuja: • Kvartiilit: luvut, jotka jakavat havainnot neljänneksiin. 25%, 50% (mediaani!!), 75 %. Alin neljännes =alle 25 prosentin rajan olevat havainnot = alakvartiili, ylin neljännes = yli 75 prosentin rajan olevat havainnot = yläkvartiili. (Tilastomatikkaa) Jakauman kuvailua:
  • 17. Opettaja: Jukka Törnroos • Hajontalukuja: • Vaihteluväli= minimiarvo -- maksimiarvo ja vaihteluvälin pituus = maksimi-minimi. • Keskihajonta otokselle: 1 )( 1 2 _ − − = ∑= n xx s n i i (Tilastomatikkaa) Jakauman kuvailua:
  • 18. Opettaja: Jukka Törnroos • Hajontalukuja: • Vaihteluväli= minimiarvo -- maksimiarvo ja vaihteluvälin pituus = maksimi-minimi. • Keskihajonta otokselle: • Varianssi = keskihajonta potenssiin 2 1 )( 1 2 _ − − = ∑= n xx s n i i (Tilastomatikkaa) Jakauman kuvailua:
  • 19. Opettaja: Jukka Törnroos • Hajontalukuja: • Keskiarvon keskivirhe: • Keskiarvon ka 95 % luottamusväli on ka - 1,96*S -- ka + 1,96*S n s S = (Tilastomatikkaa) Jakauman kuvailua:
  • 20. Keskiarvo??• 2 3 4 5 3 (kurssien laajuus) • 1 4 5 4 3 (arvosanat) • Laske kurssiarvosanojen keskiarvo ja kurssien laajudella painotettu keskiarvo. • Laske kurssiarvosanojen keskihajonta! • Kaavan selittelyä: Ensin lasketaan jokaiselle havaintoarvolle x_i erotus havaintoarvo-keskiarvo (kaavan jälkimmäinen x), • Sitten korotetaan erotukset • Toiseen potenssiin ja • Lasketaan nämä toiset • Potenssit yhteen. Tämä • Summa jaetaan n -1:llä (eli • Havaintojen lukumäärällä -1). • Lopuksi sitten vielä otetaan neliöjuuri edellä saadusta 1 )( 1 2 _ − − = ∑= n xx s n i i
  • 21. Muuttujien mitta-asteikot: • Erilaisia tietoja voidaan käsitellä eri tavoilla: käsittely riippuu ilmiön ja kysymyksen mahdollistamasta mitta- asteikosta. Opettaja: Jukka Törnroos
  • 22. • Tilastollisten muuttujien käsittelyssä käytetyt mitta-asteikot jaetaan yleensä 4 pääluokkaan: Opettaja: Jukka Törnroos Muuttujien mitta-asteikot:
  • 23. 1) Nominaali- eli luokitteluasteikko: Havainnot voidaan luokitella johonkin ryhmään. Esim. värien tai muodon mukaan luokittelu. Opettaja: Jukka Törnroos Muuttujien mitta-asteikot:
  • 24. 2) Ordinaali- eli järjestysasteikko Ryhmät voidaan järjestää mitatun asian suhteen. Esim. armeijan upseereiden arvojärjestys. Opettaja: Jukka Törnroos Muuttujien mitta-asteikot:
  • 25. 3) Intervalli- eli välimatka-asteikko: Havaintojen välinen erotus voidaan laskea. Siis välimatka tunnetaan aina. Ei välttämättä kuitenkaan keskiarvoa! Esim. Lämpötilan Fahrenheit- ja Celsius-asteet. Ei ole kiinteää nollakohtaa! Opettaja: Jukka Törnroos Muuttujien mitta-asteikot:
  • 26. 4) Absoluuttinen asteikko eli suhdeasteikko. Asteikolla on yksikäsitteinen nollapiste, jolloin voidaan laskea havaintojen välisiä suhteita (osamääriä). Esim. ikä, pituus, massa,… • Mitta-asteikoista löytyy runsaasti materiaalia Internetistä, esimerkiksi Tilastokeskuksen Verkkokoulusta. Opettaja: Jukka Törnroos Muuttujien mitta-asteikot: