際際滷

際際滷Share a Scribd company logo
Introduzione alla dispensa
 Le pagine a seguire sono degli appunti da me redatti per lesame di
  statistica e ricerche di mercato; voto preso: 21/30
 Se sei come me uno studente della IULM ti consiglio ad ogni modo
  di attenerti al programma vigente che puoi consultare al seguente
  link:
  https://servizionline.iulm.it/esse3/ProgrammaCorso.do;jsessionid=
  ?CDS_ID=10024&AA_OFF_ID=2011&AD_ID=1737&AA_ORD_ID=20
  08&PDS_ID=9999&FAT_PART_COD=N0&DOM_PART_COD=N0
 Altrimenti puoi usarlo liberamente come punto di partenza del tuo
  studio ed ampliarlo a seconda del materiale richiesto dal tuo
  docente. Esempio di come pu嘆 cambiare un programma:
  http://www.scienzepolitiche.unimi.it/CorsiDiLaurea/2013/B18of2/p
  ianoStudi/curriculum/B18-7/B18-7.13.1/index_ITA_HTML.html
Statistica: formule ed esercizi
               (parte1)

 Le frequenze
 I grafici
Le frequenze
   Assolute: descrivono il numero di volte con cui una modalit si presenta nello
    studio del carattere, si rappresentano con n i

   Assolute cumulate: 竪 la somma delle frequenze assolute; le N i servono per il
    calcolo della mediana e del secondo e terzo quartile
   Relative: consente di confrontare tra loro le modalit di due o pi湛 distribuzioni;
    si indicano con fi e si calcolano come: fi= ni/Ni. Esistono anche qui le cumulate,
    ma non sempre si calcolano. Quando si tratta di caratteri nominali le Fi non si
    calcolano.
   Percentuali: se moltiplichiamo fi per cento otteniamo le pi. Le percentuali
    cumulate servono per trovare, alternativamente, Me Q1 e Q2
   Ampiezza: si calcola quando abbiamo a che fare con caratteri che si possono
    dividere in classi; si calcola cos狸: ai=x i+1-xi-1
   Densit: di=ni/ai; si calcola per rappresentare graficamente le distribuzioni in
    classi e anche per Me; Q1 eQ3 per distribuzioni in classi
Esempi
amici(xi)             spesa (ni)               spesa (Ni)
Chicco                                50,00 50
Barbara                               55,00 105
Federico                              53,00 158
Giuseppe                              75,00 233
Elisa                                 25,00 258
Linda                                 40,00 298
Stefano                               60,00 358
Giorgia                               65,00 423
Totale                               423,00
            sesso    ni        Ni      fi          pi
            F             11                0,55        55
            M              9                0,45        45
            totale        20                   1        100
esempio
et      ni        Ni        ai       fi          pi         Fi          Pi
19-28          4         4        9         0,2         20         0,2        20
29-37          2         6        8         0,1         10         0,3        30
38-46          7        13        8        0,35         35        0,65        65
47-55          2        15        8         0,1         10        0,75        75
56-64          5        20        8        0,25         25          1         100
totale        20                             1         100
Rappresentazioni grafiche
 Torte: per rappresentare le % di un carattere qualitativo/
  quantitativo abbiamo bisogno di Ni; ni ed 留; dove 留=
  (360ni)/N
 Pittogrammi: servono per attirare l'attenzione del lettore
 Grafici a nastri e a barre: per caratteri qualitativi; nelle scale
  nominali c'竪 una gerarchia da rispettare
 Istogramma: per distribuzioni in classe
 Grafico a stella**: mostra i dati su variabili multiple in forma di un grafico
   bidimensionale di tre o pi湛 variabili, rappresentate su assi con la stessa origine.



   **http://it.wikipedia.org/wiki/Diagramma_di_Kiviat
Parte 2
   Misure di posizione centrale:
   Media; Mediana e quartili per unit e classi
   Scorciatoie
   Altre misure di dispersione
Misure di posizione centrale
 La media*: 竪 la forma pi湛 semplice di sintesi numerica e si calcola cos狸:
a)     M=
           x n sendiversoda1;M =  x sen =1
                             i   i                                 i
            N                            N

b)     M=
           x v.c. perclassiilvalorecentrale竪lamediadeilimiti
                         i           i
            N
  La mediana: individua la met precisa di un collettivo statistico; per
   calcolarla bisogna:
  Ordinare le ni in ordine crescente
  Calcolare Ni
  Applicare una di queste due formule:
             N 1                                  N N 1                     X
    X Me =        ;conN =dispariX         Me   =     e    ;conN =dispari  Me= Me
               2                                   2   2                       2

    Per la distribuzione in classi applicher嘆 invece la seguente formula, a
     prescindere dal collettivo:
                       N 1         a                                                           ai
      X Me =l inf         N i1  i ;conl        inf   =limiteinferioredellaclassemedianae      =l'inversodelladensitdellaclassemediana
                         2          ni                                                          ni




     *竪 meglio dire medie infatti oltre alla media aritmetica altre medie (vedi
     tabella 1)
Misure di posizione centrale
 Quartili: oltre alla mediana, Q2, ce ne sono
  due: Q1 indica dove ricade il 25% del
  collettivo statistico esaminato; Q3 dove
  ricade il restante 75%
 Per calcolarli bisogna seguire gli stessi step

  di Q1 ed applicare per le distribuzioni in
  unit le seguenti formule:
            N 1       3 N 1
     Q1 =        ;Q 3=          ;
              4            4


   Mentre per quelle in classi:
                               ai                            ai
    Q1 =l inf  N 10,25      ;Q 3=l inf  N 1 0,75
                               ni                            ni
Esempio
 Calcolare la mediana e i quartili di questo
  collettivo
               Ordino e
               calcolo Ni




 calcolo   N/2=4/2=2; N/2+1=3   Q1=(N+1)*0,25=1,25 竪 in
           quindi la distanza   prima posizione quindi 12km
           mediana 竪 18km       Q2=(N+1)*0,75=3,75 quindi
                                90km
Scorciatoie
 Se, una volta ordinate le ni in modo
  crescente, calcolo le Ni e le Pi trovo pi湛
  velocemente i quartili infatti:
 Q1=P1=50%


 Q2=P2=25%


 Q3=P3=75%
Esempio scorciatoia
 Calcolare la mediana e i quartili di questo
  collettivo
                 Ordino e
                 calcolo Ni e Pi




   Stesso risultato con meno sforzo!
Esercizio
 Calcolare la distanza media, mediana e quartile di questo
  collettivo e rappresentare i dati con apposito grafico:

                                                       ni=1


                                                              N=4
                             M=(370*1)/4=92,5




         Q1=12km; Q2=18; Q3=90km
Esercizio(continua)
 Il grafico pi湛 giusto per rappresentare i dati 竪
  il diagramma a barre
Esercizio (continua)
 Qui si utilizza l'istogramma
                   grafico                                       grafico Q1;Q2;Q3
     2,5                                                 2,5

      2                                                   2

     1,5                                                 1,5
di




                                                    di
      1                                                   1

     0,5                                                 0,5

      0                                                   0
           10_30   30-40            40-50   50-70              50-70    40-50       10_30
                           classi                                       classi
Parte3
 Misure di dispersione:
 Differenza interquartilica


 Range


 Varianza


 Scarto quadratico medio e coefficiente di

  variazione
Misure di dispersione
 Differenza interquartilica: nelle ricerche di marketing serve
  per calcolare il potere discriminante di una scala likert, o
  stepel, e per rappresentare il box plot: un grafico per
  individuare eventuali outlier
     D.I.=Q3Q 1 l inf =Q11,5D.I.l 多 =Q31,5D.I.



 Range: viene detto anche campo di variazione e viene
  definito come la differenza tra il valore pi湛 grande e il
  valore pi湛 piccolo di un insieme di dati ordinati in ordine
  crescente
                                                         R
     R=X max  X min perch竪siaattendibileX   max   X M 賊  X min
                                                         2
Esercizi
 Calcolare la mediana e i quartili di questo
  collettivo e in seguito la D.I.

                                      Q1=12km; Q2=18; Q3=90km
                                      D.I.=90-12=72km
                                      Linf=12-117=-105
                                      Linf=90+117=207




       xmin=8               xmax=30


                R=30-8=22
Misura di dispersione (continua)
 La varianza: rappresenta lo scostamento da un valore di un
  riferimento, la media in questo caso, che ho preso come
  rappresentativo; per calcolarla:
 Ordino le xi in modo crescente
 Calcolo la media
 Ed applico:
                   (         )
                                  2
                         xi
    =      x-i2
                     n
   Per le distribuzioni in classi:

                      ( xf(x) i )
                                      2

    =    2               i
         xf(x) i    
          i
                         f(x)i
Misure di dispersione (fine)
 Scarto quadratico medio: lo si ottiene
  estraendo la radice quadrata della varianza
 Il coefficiente di variazione: 竪 una
  percentuale utile a misurare senza errori di
  misura due differenti distribuzioni:
                     s.q.m
             C.V.=         100
                       M
Esercizio

 Calcolare media, varianza, s.q.m. e c.v. della seguente distribuzione e
  rappresentare graficamente la media assieme ai quartili
                                               300

                                               250


                          km percorsi          200

                                               150

                                               100

                                                 50

                                                  0
                                                      Mara   Luca   Laura   Media   Fabio
                                        km percorsi    12     18     90     92,5    250


                               Questa distribuzione si dice asimmetrica a destra
                               in quanto Me<M.
                               Altrimenti, Me>M, 竪 asimmetrica a sinistra.
                               Infine, una distribuzione risulta simmetrica
                               quando Me=M
Esercizio
 Calcolare media, varianza, s.q.m. e c.v. della seguente
  distribuzione in classi
Parte4
 Altre misure di dispersione:
 Scarto semplice medio dalla media


 Scarto semplice medio dalla mediana
Scostamento semplice medio
 Dalla media

   X Mbn i oppure,davantiafrequenzeunitarie,  X  M
         N                                            N




 Dalla mediana
 X Mebni oppure,davantiafrequenzeunitarie, X  Me
     N                                            N
esercizio
 Calcolare media mediana e i due scarti
  semplici della seguente distribuzione
Due grafici particolari
 La curva normale: la utilizzo quando ho a che fare con
  variabili continue e voglio sapere, note M s.q.m e varianza,
  le frequenze assolute e relative tramite processo di
  standardizzazione.

 Il box plot: lo derivo dall'istogramma e lo uso quando
  voglio sapere se mi trovo davanti a possibili outlier e se la
  mia distribuzione esaminata 竪 asimmetrica, mi dice pure
  dove, oppure no
Un esempio di curva normale
Appunti di statistica
A me tuttavia interessa l'area da 1.36 in poi
(quella piccola area blu)
Formulario riassuntivo(parti1-4)
Formulario riassuntivo(parti1-4)
Esercizi
   Costruire l'istogramma della seguente distribuzione e calcolarne i quartili




   La seguente tabella riporta la superficie delle provincie della Campania; costruire un
    grafico a torta




   Nella seguente tabella 竪 riportata la distribuzione delle fa per n属 di componenti in un
    dato comune: calcolarne la media e i quartili
Appunti di statistica
Appunti di statistica
Appunti di statistica

More Related Content

Appunti di statistica

  • 1. Introduzione alla dispensa Le pagine a seguire sono degli appunti da me redatti per lesame di statistica e ricerche di mercato; voto preso: 21/30 Se sei come me uno studente della IULM ti consiglio ad ogni modo di attenerti al programma vigente che puoi consultare al seguente link: https://servizionline.iulm.it/esse3/ProgrammaCorso.do;jsessionid= ?CDS_ID=10024&AA_OFF_ID=2011&AD_ID=1737&AA_ORD_ID=20 08&PDS_ID=9999&FAT_PART_COD=N0&DOM_PART_COD=N0 Altrimenti puoi usarlo liberamente come punto di partenza del tuo studio ed ampliarlo a seconda del materiale richiesto dal tuo docente. Esempio di come pu嘆 cambiare un programma: http://www.scienzepolitiche.unimi.it/CorsiDiLaurea/2013/B18of2/p ianoStudi/curriculum/B18-7/B18-7.13.1/index_ITA_HTML.html
  • 2. Statistica: formule ed esercizi (parte1) Le frequenze I grafici
  • 3. Le frequenze Assolute: descrivono il numero di volte con cui una modalit si presenta nello studio del carattere, si rappresentano con n i Assolute cumulate: 竪 la somma delle frequenze assolute; le N i servono per il calcolo della mediana e del secondo e terzo quartile Relative: consente di confrontare tra loro le modalit di due o pi湛 distribuzioni; si indicano con fi e si calcolano come: fi= ni/Ni. Esistono anche qui le cumulate, ma non sempre si calcolano. Quando si tratta di caratteri nominali le Fi non si calcolano. Percentuali: se moltiplichiamo fi per cento otteniamo le pi. Le percentuali cumulate servono per trovare, alternativamente, Me Q1 e Q2 Ampiezza: si calcola quando abbiamo a che fare con caratteri che si possono dividere in classi; si calcola cos狸: ai=x i+1-xi-1 Densit: di=ni/ai; si calcola per rappresentare graficamente le distribuzioni in classi e anche per Me; Q1 eQ3 per distribuzioni in classi
  • 4. Esempi amici(xi) spesa (ni) spesa (Ni) Chicco 50,00 50 Barbara 55,00 105 Federico 53,00 158 Giuseppe 75,00 233 Elisa 25,00 258 Linda 40,00 298 Stefano 60,00 358 Giorgia 65,00 423 Totale 423,00 sesso ni Ni fi pi F 11 0,55 55 M 9 0,45 45 totale 20 1 100
  • 5. esempio et ni Ni ai fi pi Fi Pi 19-28 4 4 9 0,2 20 0,2 20 29-37 2 6 8 0,1 10 0,3 30 38-46 7 13 8 0,35 35 0,65 65 47-55 2 15 8 0,1 10 0,75 75 56-64 5 20 8 0,25 25 1 100 totale 20 1 100
  • 6. Rappresentazioni grafiche Torte: per rappresentare le % di un carattere qualitativo/ quantitativo abbiamo bisogno di Ni; ni ed 留; dove 留= (360ni)/N Pittogrammi: servono per attirare l'attenzione del lettore Grafici a nastri e a barre: per caratteri qualitativi; nelle scale nominali c'竪 una gerarchia da rispettare Istogramma: per distribuzioni in classe Grafico a stella**: mostra i dati su variabili multiple in forma di un grafico bidimensionale di tre o pi湛 variabili, rappresentate su assi con la stessa origine. **http://it.wikipedia.org/wiki/Diagramma_di_Kiviat
  • 7. Parte 2 Misure di posizione centrale: Media; Mediana e quartili per unit e classi Scorciatoie Altre misure di dispersione
  • 8. Misure di posizione centrale La media*: 竪 la forma pi湛 semplice di sintesi numerica e si calcola cos狸: a) M= x n sendiversoda1;M = x sen =1 i i i N N b) M= x v.c. perclassiilvalorecentrale竪lamediadeilimiti i i N La mediana: individua la met precisa di un collettivo statistico; per calcolarla bisogna: Ordinare le ni in ordine crescente Calcolare Ni Applicare una di queste due formule: N 1 N N 1 X X Me = ;conN =dispariX Me = e ;conN =dispari Me= Me 2 2 2 2 Per la distribuzione in classi applicher嘆 invece la seguente formula, a prescindere dal collettivo: N 1 a ai X Me =l inf N i1 i ;conl inf =limiteinferioredellaclassemedianae =l'inversodelladensitdellaclassemediana 2 ni ni *竪 meglio dire medie infatti oltre alla media aritmetica altre medie (vedi tabella 1)
  • 9. Misure di posizione centrale Quartili: oltre alla mediana, Q2, ce ne sono due: Q1 indica dove ricade il 25% del collettivo statistico esaminato; Q3 dove ricade il restante 75% Per calcolarli bisogna seguire gli stessi step di Q1 ed applicare per le distribuzioni in unit le seguenti formule: N 1 3 N 1 Q1 = ;Q 3= ; 4 4 Mentre per quelle in classi: ai ai Q1 =l inf N 10,25 ;Q 3=l inf N 1 0,75 ni ni
  • 10. Esempio Calcolare la mediana e i quartili di questo collettivo Ordino e calcolo Ni calcolo N/2=4/2=2; N/2+1=3 Q1=(N+1)*0,25=1,25 竪 in quindi la distanza prima posizione quindi 12km mediana 竪 18km Q2=(N+1)*0,75=3,75 quindi 90km
  • 11. Scorciatoie Se, una volta ordinate le ni in modo crescente, calcolo le Ni e le Pi trovo pi湛 velocemente i quartili infatti: Q1=P1=50% Q2=P2=25% Q3=P3=75%
  • 12. Esempio scorciatoia Calcolare la mediana e i quartili di questo collettivo Ordino e calcolo Ni e Pi Stesso risultato con meno sforzo!
  • 13. Esercizio Calcolare la distanza media, mediana e quartile di questo collettivo e rappresentare i dati con apposito grafico: ni=1 N=4 M=(370*1)/4=92,5 Q1=12km; Q2=18; Q3=90km
  • 14. Esercizio(continua) Il grafico pi湛 giusto per rappresentare i dati 竪 il diagramma a barre
  • 15. Esercizio (continua) Qui si utilizza l'istogramma grafico grafico Q1;Q2;Q3 2,5 2,5 2 2 1,5 1,5 di di 1 1 0,5 0,5 0 0 10_30 30-40 40-50 50-70 50-70 40-50 10_30 classi classi
  • 16. Parte3 Misure di dispersione: Differenza interquartilica Range Varianza Scarto quadratico medio e coefficiente di variazione
  • 17. Misure di dispersione Differenza interquartilica: nelle ricerche di marketing serve per calcolare il potere discriminante di una scala likert, o stepel, e per rappresentare il box plot: un grafico per individuare eventuali outlier D.I.=Q3Q 1 l inf =Q11,5D.I.l 多 =Q31,5D.I. Range: viene detto anche campo di variazione e viene definito come la differenza tra il valore pi湛 grande e il valore pi湛 piccolo di un insieme di dati ordinati in ordine crescente R R=X max X min perch竪siaattendibileX max X M 賊 X min 2
  • 18. Esercizi Calcolare la mediana e i quartili di questo collettivo e in seguito la D.I. Q1=12km; Q2=18; Q3=90km D.I.=90-12=72km Linf=12-117=-105 Linf=90+117=207 xmin=8 xmax=30 R=30-8=22
  • 19. Misura di dispersione (continua) La varianza: rappresenta lo scostamento da un valore di un riferimento, la media in questo caso, che ho preso come rappresentativo; per calcolarla: Ordino le xi in modo crescente Calcolo la media Ed applico: ( ) 2 xi = x-i2 n Per le distribuzioni in classi: ( xf(x) i ) 2 = 2 i xf(x) i i f(x)i
  • 20. Misure di dispersione (fine) Scarto quadratico medio: lo si ottiene estraendo la radice quadrata della varianza Il coefficiente di variazione: 竪 una percentuale utile a misurare senza errori di misura due differenti distribuzioni: s.q.m C.V.= 100 M
  • 21. Esercizio Calcolare media, varianza, s.q.m. e c.v. della seguente distribuzione e rappresentare graficamente la media assieme ai quartili 300 250 km percorsi 200 150 100 50 0 Mara Luca Laura Media Fabio km percorsi 12 18 90 92,5 250 Questa distribuzione si dice asimmetrica a destra in quanto Me<M. Altrimenti, Me>M, 竪 asimmetrica a sinistra. Infine, una distribuzione risulta simmetrica quando Me=M
  • 22. Esercizio Calcolare media, varianza, s.q.m. e c.v. della seguente distribuzione in classi
  • 23. Parte4 Altre misure di dispersione: Scarto semplice medio dalla media Scarto semplice medio dalla mediana
  • 24. Scostamento semplice medio Dalla media X Mbn i oppure,davantiafrequenzeunitarie, X M N N Dalla mediana X Mebni oppure,davantiafrequenzeunitarie, X Me N N
  • 25. esercizio Calcolare media mediana e i due scarti semplici della seguente distribuzione
  • 26. Due grafici particolari La curva normale: la utilizzo quando ho a che fare con variabili continue e voglio sapere, note M s.q.m e varianza, le frequenze assolute e relative tramite processo di standardizzazione. Il box plot: lo derivo dall'istogramma e lo uso quando voglio sapere se mi trovo davanti a possibili outlier e se la mia distribuzione esaminata 竪 asimmetrica, mi dice pure dove, oppure no
  • 27. Un esempio di curva normale
  • 29. A me tuttavia interessa l'area da 1.36 in poi (quella piccola area blu)
  • 32. Esercizi Costruire l'istogramma della seguente distribuzione e calcolarne i quartili La seguente tabella riporta la superficie delle provincie della Campania; costruire un grafico a torta Nella seguente tabella 竪 riportata la distribuzione delle fa per n属 di componenti in un dato comune: calcolarne la media e i quartili