appunti di statistica descrittiva per studenti IULM e per tutti coloro che hanno nel loro piano di studi tale materia.
1 of 35
Downloaded 13 times
More Related Content
Appunti di statistica
1. Introduzione alla dispensa
Le pagine a seguire sono degli appunti da me redatti per lesame di
statistica e ricerche di mercato; voto preso: 21/30
Se sei come me uno studente della IULM ti consiglio ad ogni modo
di attenerti al programma vigente che puoi consultare al seguente
link:
https://servizionline.iulm.it/esse3/ProgrammaCorso.do;jsessionid=
?CDS_ID=10024&AA_OFF_ID=2011&AD_ID=1737&AA_ORD_ID=20
08&PDS_ID=9999&FAT_PART_COD=N0&DOM_PART_COD=N0
Altrimenti puoi usarlo liberamente come punto di partenza del tuo
studio ed ampliarlo a seconda del materiale richiesto dal tuo
docente. Esempio di come pu嘆 cambiare un programma:
http://www.scienzepolitiche.unimi.it/CorsiDiLaurea/2013/B18of2/p
ianoStudi/curriculum/B18-7/B18-7.13.1/index_ITA_HTML.html
3. Le frequenze
Assolute: descrivono il numero di volte con cui una modalit si presenta nello
studio del carattere, si rappresentano con n i
Assolute cumulate: 竪 la somma delle frequenze assolute; le N i servono per il
calcolo della mediana e del secondo e terzo quartile
Relative: consente di confrontare tra loro le modalit di due o pi湛 distribuzioni;
si indicano con fi e si calcolano come: fi= ni/Ni. Esistono anche qui le cumulate,
ma non sempre si calcolano. Quando si tratta di caratteri nominali le Fi non si
calcolano.
Percentuali: se moltiplichiamo fi per cento otteniamo le pi. Le percentuali
cumulate servono per trovare, alternativamente, Me Q1 e Q2
Ampiezza: si calcola quando abbiamo a che fare con caratteri che si possono
dividere in classi; si calcola cos狸: ai=x i+1-xi-1
Densit: di=ni/ai; si calcola per rappresentare graficamente le distribuzioni in
classi e anche per Me; Q1 eQ3 per distribuzioni in classi
4. Esempi
amici(xi) spesa (ni) spesa (Ni)
Chicco 50,00 50
Barbara 55,00 105
Federico 53,00 158
Giuseppe 75,00 233
Elisa 25,00 258
Linda 40,00 298
Stefano 60,00 358
Giorgia 65,00 423
Totale 423,00
sesso ni Ni fi pi
F 11 0,55 55
M 9 0,45 45
totale 20 1 100
5. esempio
et ni Ni ai fi pi Fi Pi
19-28 4 4 9 0,2 20 0,2 20
29-37 2 6 8 0,1 10 0,3 30
38-46 7 13 8 0,35 35 0,65 65
47-55 2 15 8 0,1 10 0,75 75
56-64 5 20 8 0,25 25 1 100
totale 20 1 100
6. Rappresentazioni grafiche
Torte: per rappresentare le % di un carattere qualitativo/
quantitativo abbiamo bisogno di Ni; ni ed 留; dove 留=
(360ni)/N
Pittogrammi: servono per attirare l'attenzione del lettore
Grafici a nastri e a barre: per caratteri qualitativi; nelle scale
nominali c'竪 una gerarchia da rispettare
Istogramma: per distribuzioni in classe
Grafico a stella**: mostra i dati su variabili multiple in forma di un grafico
bidimensionale di tre o pi湛 variabili, rappresentate su assi con la stessa origine.
**http://it.wikipedia.org/wiki/Diagramma_di_Kiviat
7. Parte 2
Misure di posizione centrale:
Media; Mediana e quartili per unit e classi
Scorciatoie
Altre misure di dispersione
8. Misure di posizione centrale
La media*: 竪 la forma pi湛 semplice di sintesi numerica e si calcola cos狸:
a) M=
x n sendiversoda1;M = x sen =1
i i i
N N
b) M=
x v.c. perclassiilvalorecentrale竪lamediadeilimiti
i i
N
La mediana: individua la met precisa di un collettivo statistico; per
calcolarla bisogna:
Ordinare le ni in ordine crescente
Calcolare Ni
Applicare una di queste due formule:
N 1 N N 1 X
X Me = ;conN =dispariX Me = e ;conN =dispari Me= Me
2 2 2 2
Per la distribuzione in classi applicher嘆 invece la seguente formula, a
prescindere dal collettivo:
N 1 a ai
X Me =l inf N i1 i ;conl inf =limiteinferioredellaclassemedianae =l'inversodelladensitdellaclassemediana
2 ni ni
*竪 meglio dire medie infatti oltre alla media aritmetica altre medie (vedi
tabella 1)
9. Misure di posizione centrale
Quartili: oltre alla mediana, Q2, ce ne sono
due: Q1 indica dove ricade il 25% del
collettivo statistico esaminato; Q3 dove
ricade il restante 75%
Per calcolarli bisogna seguire gli stessi step
di Q1 ed applicare per le distribuzioni in
unit le seguenti formule:
N 1 3 N 1
Q1 = ;Q 3= ;
4 4
Mentre per quelle in classi:
ai ai
Q1 =l inf N 10,25 ;Q 3=l inf N 1 0,75
ni ni
10. Esempio
Calcolare la mediana e i quartili di questo
collettivo
Ordino e
calcolo Ni
calcolo N/2=4/2=2; N/2+1=3 Q1=(N+1)*0,25=1,25 竪 in
quindi la distanza prima posizione quindi 12km
mediana 竪 18km Q2=(N+1)*0,75=3,75 quindi
90km
11. Scorciatoie
Se, una volta ordinate le ni in modo
crescente, calcolo le Ni e le Pi trovo pi湛
velocemente i quartili infatti:
Q1=P1=50%
Q2=P2=25%
Q3=P3=75%
12. Esempio scorciatoia
Calcolare la mediana e i quartili di questo
collettivo
Ordino e
calcolo Ni e Pi
Stesso risultato con meno sforzo!
13. Esercizio
Calcolare la distanza media, mediana e quartile di questo
collettivo e rappresentare i dati con apposito grafico:
ni=1
N=4
M=(370*1)/4=92,5
Q1=12km; Q2=18; Q3=90km
15. Esercizio (continua)
Qui si utilizza l'istogramma
grafico grafico Q1;Q2;Q3
2,5 2,5
2 2
1,5 1,5
di
di
1 1
0,5 0,5
0 0
10_30 30-40 40-50 50-70 50-70 40-50 10_30
classi classi
16. Parte3
Misure di dispersione:
Differenza interquartilica
Range
Varianza
Scarto quadratico medio e coefficiente di
variazione
17. Misure di dispersione
Differenza interquartilica: nelle ricerche di marketing serve
per calcolare il potere discriminante di una scala likert, o
stepel, e per rappresentare il box plot: un grafico per
individuare eventuali outlier
D.I.=Q3Q 1 l inf =Q11,5D.I.l 多 =Q31,5D.I.
Range: viene detto anche campo di variazione e viene
definito come la differenza tra il valore pi湛 grande e il
valore pi湛 piccolo di un insieme di dati ordinati in ordine
crescente
R
R=X max X min perch竪siaattendibileX max X M 賊 X min
2
18. Esercizi
Calcolare la mediana e i quartili di questo
collettivo e in seguito la D.I.
Q1=12km; Q2=18; Q3=90km
D.I.=90-12=72km
Linf=12-117=-105
Linf=90+117=207
xmin=8 xmax=30
R=30-8=22
19. Misura di dispersione (continua)
La varianza: rappresenta lo scostamento da un valore di un
riferimento, la media in questo caso, che ho preso come
rappresentativo; per calcolarla:
Ordino le xi in modo crescente
Calcolo la media
Ed applico:
( )
2
xi
= x-i2
n
Per le distribuzioni in classi:
( xf(x) i )
2
= 2 i
xf(x) i
i
f(x)i
20. Misure di dispersione (fine)
Scarto quadratico medio: lo si ottiene
estraendo la radice quadrata della varianza
Il coefficiente di variazione: 竪 una
percentuale utile a misurare senza errori di
misura due differenti distribuzioni:
s.q.m
C.V.= 100
M
21. Esercizio
Calcolare media, varianza, s.q.m. e c.v. della seguente distribuzione e
rappresentare graficamente la media assieme ai quartili
300
250
km percorsi 200
150
100
50
0
Mara Luca Laura Media Fabio
km percorsi 12 18 90 92,5 250
Questa distribuzione si dice asimmetrica a destra
in quanto Me<M.
Altrimenti, Me>M, 竪 asimmetrica a sinistra.
Infine, una distribuzione risulta simmetrica
quando Me=M
23. Parte4
Altre misure di dispersione:
Scarto semplice medio dalla media
Scarto semplice medio dalla mediana
24. Scostamento semplice medio
Dalla media
X Mbn i oppure,davantiafrequenzeunitarie, X M
N N
Dalla mediana
X Mebni oppure,davantiafrequenzeunitarie, X Me
N N
26. Due grafici particolari
La curva normale: la utilizzo quando ho a che fare con
variabili continue e voglio sapere, note M s.q.m e varianza,
le frequenze assolute e relative tramite processo di
standardizzazione.
Il box plot: lo derivo dall'istogramma e lo uso quando
voglio sapere se mi trovo davanti a possibili outlier e se la
mia distribuzione esaminata 竪 asimmetrica, mi dice pure
dove, oppure no
32. Esercizi
Costruire l'istogramma della seguente distribuzione e calcolarne i quartili
La seguente tabella riporta la superficie delle provincie della Campania; costruire un
grafico a torta
Nella seguente tabella 竪 riportata la distribuzione delle fa per n属 di componenti in un
dato comune: calcolarne la media e i quartili