2. TILASTOLLISEN KUVAUKSEN
PERUSTEET SANASTOA
• Alakvartiili: Raja, jonka alle jää 25 % havainnoista. Rautalankamalli
tämän määrittämiseksi:
1) Laita havainnot suuruusjärjestykseen ja määritä sitten mediaani
(havaintojen keskikohta)
2) Jaa havainnot mediaanin avulla suuriin (suurempia kuin mediaani)
ja pieniin (pienempiä kuin mediaani) ja määritä sitten pienien lukujen
mediaani, joka on sama kuin alakvartiili.
• Keskiarvo: Yleensä tällä tarkoitetaan havaintojen summaa jaettuna
havaintojen lukumäärällä. (Jos on käytetty jotain muuta laskutapaa,
tämä kannattaa kertoa.) On yksi tavallisimmin käytetyistä
tilastollisista tunnusluvuista.
3. TILASTOLLISEN KUVAUKSEN
PERUSTEET SANASTOA
• Keskihajonta: Kuvaa sitä, miten laajalle alueelle havainnot
jakautuvat keskiarvon ympärille. Tarkemmin sanottuna arvo kertoo
sen, kuinka kaukana keskiarvosta havainnot keskimäärin sijaitsevat.
• Kumulatiivinen frekvenssi /prosenttiosuus: Tästä käytetään
myös nimitystä summafrekvenssi, tai –prosentti. Kuvaa sitä, kuinka
monta havaintoa tai prosenttia havainnoista kuuluu yhteensä kyseessä
olevaan ja sitä edeltäviin luokkiin, kun havainnot on luokiteltu.
• Mediaani: Tarkoittaa suuruusjärjestykseen laitettujen havaintojen
keskikohtaa. Jos havaintoja on pariton määrä, tämä on joukon
keskimmäisenä oleva arvo. Jos havaintoja on parillinen määrä,
mediaani on kahden keskimmäisen arvon keskiarvo.
4. TILASTOLLISEN KUVAUKSEN
PERUSTEET SANASTOA
• Yläkvartiili Raja, jonka alle jää 75 % havainnoista. Voidaan
määritellä vastaavasti kuin alakvartiili käyttäen mediaania suurempien
havaintojen joukkoa.
5. Opettaja: Jukka Törnroos
Tilastomatematiikkaa ja vähän
muuta
• Normaalijakauma
• Keskiluvut (aritmeettinen ja painotettu
keskiarvo, mediaani, moodi)
• sijaintilukuja: fraktiileja ( kvartiilit, desiilit,
persentiilit)
• Tilastollisten muuttujien mitta-asteikot
6. Opettaja: Jukka Törnroos
Alkuverryttelyä (1)
• Tilastokurssin osallistujia on 20 ja
heidän keskipituudekseen saatiin 167
cm. Mikä oli heidän todellinen
keskipituutensa, kun huomattiin, että
yhden osallistujan pituus oli kirjattu
väärin 18 cm liian pitkäksi?
7. Opettaja: Jukka Törnroos
Alkuverryttelyä (2)
• Tilastokurssilla oli 23 nais- ja 2
miesossallistujaa. Kuinka suuri
prosenttiosuus osallistujista oli miehiä ja
kuinka suuri prosenttiosuus oli naisia?
9. Opettaja: Jukka Törnroos
Normaalijakauma
• Määritellään matemaattisesti kahden
tunnusluvun avulla: Keskiarvon μ ja
keskihajonnan σ (luku, joka kuvaa
havaintojen ryhmittymistä keskiarvon
ympärille) avulla: esim. N (0, 1) tarkoittaa
normaalijakaumaa keskiarvolla 0 ja
keskihajonnalla 1.
10. Opettaja: Jukka Törnroos
Normaalijakauma
• Jos tiedetään, että aineisto noudattaa
normaalijakaumaa, havainnoista noin 68,3 %
sijaitsee välillä (μ - σ) -- (μ + σ) ja noin 95,4 %
välillä(μ - 2σ) -- (μ + 2σ)
12. Opettaja: Jukka Törnroos
(Tilasto)matematiikkaa
• Tilastolliset tunnusluvut:
• Aritmeettinen keskiarvo:
• Aritmeettista keskiarvoa käytetään, jos
käytössä ei ole painokertoimia!
n
x
n
i
i
x
∑
= =1
_
13. Opettaja: Jukka Törnroos
(Tilastomatikkaa)
• Painotettu keskiarvo:
– Yleensä tilastollisten
tutkimusten tuloksia
pyritään tarkentamaan
painokertoimilla:
– Korjataan otoksen mahdollisia vinoutumia esim.,
jos miesten ja naisten suhde poikkeaa
teoreettisesta (”normaali” 50:50??)
∑
∑
=
=
=
n
i
i
n
i
i
a
ax
x
1
1
_
14. Opettaja: Jukka Törnroos
Keskilukuja
• Keskiarvoa käytetään yleisimmin, mutta aina
se ei sovi (riippuu jakauman ominaisuuksista
ja käytetystä mitta-asteikosta
• Mediaani: Arvo, joka jakaa havainnot kahteen
yhtä suureen osaan.
• Moodi: Tyyppiarvo, eli yleisin havaintoarvo
(voi olla useita!)
15. Opettaja: Jukka Törnroos
(Tilastomatikkaa)
Jakauman kuvailua:
• Sijaintilukuja:
• Persentiili: luku, jonka alle jää esim. 95 %
havaintoarvoista (=95. Persentiili) Vastaavasti
esim. 5. Persentiili on arvo, jonka alle jää 5 %
havainnoista.
• Desiilit jakavat havaintojoukon kymmeneen
yhtä suureen ”viipaleeseen”. =Samat kuin
10., 20., 30.,…80. Ja 90. persentiilit
16. Opettaja: Jukka Törnroos
• Sijaintilukuja:
• Kvartiilit: luvut, jotka jakavat havainnot
neljänneksiin. 25%, 50% (mediaani!!), 75 %.
Alin neljännes =alle 25 prosentin rajan olevat
havainnot = alakvartiili, ylin neljännes = yli 75
prosentin rajan olevat havainnot = yläkvartiili.
(Tilastomatikkaa)
Jakauman kuvailua:
17. Opettaja: Jukka Törnroos
• Hajontalukuja:
• Vaihteluväli= minimiarvo -- maksimiarvo ja
vaihteluvälin pituus = maksimi-minimi.
• Keskihajonta otokselle:
1
)(
1
2
_
−
−
=
∑=
n
xx
s
n
i
i
(Tilastomatikkaa)
Jakauman kuvailua:
18. Opettaja: Jukka Törnroos
• Hajontalukuja:
• Vaihteluväli= minimiarvo -- maksimiarvo ja
vaihteluvälin pituus = maksimi-minimi.
• Keskihajonta otokselle:
• Varianssi =
keskihajonta
potenssiin 2
1
)(
1
2
_
−
−
=
∑=
n
xx
s
n
i
i
(Tilastomatikkaa)
Jakauman kuvailua:
19. Opettaja: Jukka Törnroos
• Hajontalukuja:
• Keskiarvon keskivirhe:
• Keskiarvon ka 95 % luottamusväli on
ka - 1,96*S -- ka + 1,96*S
n
s
S =
(Tilastomatikkaa)
Jakauman kuvailua:
20. Keskiarvo??• 2 3 4 5 3 (kurssien laajuus)
• 1 4 5 4 3 (arvosanat)
• Laske kurssiarvosanojen keskiarvo ja kurssien laajudella
painotettu keskiarvo.
• Laske kurssiarvosanojen keskihajonta!
• Kaavan selittelyä: Ensin lasketaan jokaiselle
havaintoarvolle x_i erotus havaintoarvo-keskiarvo
(kaavan jälkimmäinen x),
• Sitten korotetaan erotukset
• Toiseen potenssiin ja
• Lasketaan nämä toiset
• Potenssit yhteen. Tämä
• Summa jaetaan n -1:llä (eli
• Havaintojen lukumäärällä -1).
• Lopuksi sitten vielä otetaan neliöjuuri edellä saadusta
1
)(
1
2
_
−
−
=
∑=
n
xx
s
n
i
i
21. Muuttujien mitta-asteikot:
• Erilaisia tietoja voidaan käsitellä eri
tavoilla: käsittely riippuu ilmiön ja
kysymyksen mahdollistamasta mitta-
asteikosta.
Opettaja: Jukka Törnroos
22. • Tilastollisten muuttujien käsittelyssä
käytetyt mitta-asteikot jaetaan yleensä 4
pääluokkaan:
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot:
23. 1) Nominaali- eli luokitteluasteikko:
Havainnot voidaan luokitella johonkin
ryhmään. Esim. värien tai muodon mukaan
luokittelu.
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot:
24. 2) Ordinaali- eli järjestysasteikko
Ryhmät voidaan järjestää mitatun asian
suhteen. Esim. armeijan upseereiden
arvojärjestys.
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot:
25. 3) Intervalli- eli välimatka-asteikko:
Havaintojen välinen erotus voidaan laskea.
Siis välimatka tunnetaan aina. Ei
välttämättä kuitenkaan keskiarvoa! Esim.
Lämpötilan Fahrenheit- ja Celsius-asteet. Ei
ole kiinteää nollakohtaa!
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot:
26. 4) Absoluuttinen asteikko eli suhdeasteikko.
Asteikolla on yksikäsitteinen nollapiste,
jolloin voidaan laskea havaintojen välisiä
suhteita (osamääriä). Esim. ikä, pituus,
massa,…
• Mitta-asteikoista löytyy runsaasti
materiaalia Internetistä, esimerkiksi
Tilastokeskuksen Verkkokoulusta.
Opettaja: Jukka Törnroos
Muuttujien mitta-asteikot: