19 aprile 2008 1 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
Repetita iuvant
• Rappresentazioni grafiche var. qualitative (barre, torta)• Sintesi di variabili quantitative:
– Min, max– Media, proprietà:
• Internalità• Baricentro• Linearità• Minimizzazione somma quadrati scarti
i (xi – )2 i (xi – )2 per qualsiasi
– Media ponderata
19 aprile 2008 2 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
Variabilità per variabili quantitative
1. campo di variazione: max(Xi) – min(Xi)
2. scarto interquartile:
a) quartili:
mediana → 2 parti ugualiquartili → 4 parti uguali
Q1 → valore associato all’unità ordinata cheviene dopo il primo 25%
Q2 → valore associato all’unità ordinata cheviene dopo il primo 50% (Mediana!!!)
19 aprile 2008 3 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
Q3 → valore associato all’unità ordinata cheviene dopo il primo 75%
Q4 → valore associato all’unità ordinata cheviene dopo il primo 100% (Max!!!)
in pratica:I. si ordinano le unitàII. si individuano le unità portatrici di Q1 e Q3:
i. Q1 = x((n+1)/4)
ii. Q3 = x((n+1)3/4)
N.b. il quartile, come la mediana, non è la posizione
bensì la modalità associata alla posizione!
19 aprile 2008 4 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
III. se le posizioni non sono un numero intero?
i. si considera la parte intera separata da quella decimale:
Es.: n = 29 → (n + 1)/4 = 30/4 = 7,5
parte intera c1 = [(n + 1)/4] → 7
parte decimale d1 = (n + 1)/4 – [(n + 1)/4] → 0,5
Q1 = x(c1) + d1(x(c1+1) – x(c1)) =
= x(7) + 0,5(x(8) – x(7)) = 18 Età ni fi Ni Fi
18 10 0,345 10 0,345
19 3 0,104 13 0,449
20 7 0,241 20 0,690
21 9 0,310 29 1,000
Totale 29 1,000
19 aprile 2008 5 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
→ (n + 1)3/4 = 90/4 = 22,5
parte intera c3 → 22
parte decimale d3 → 0,5
Q3 = x(c3) + d3(x(c3+1) – x(c3)) =
= x(22) + 0,5(x(23) – x(22)) = 21
Età ni fi Ni Fi
18 10 0,345 10 0,345
19 3 0,104 13 0,449
20 7 0,241 20 0,690
21 9 0,310 29 1,000
Totale 29 1,000
19 aprile 2008 6 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
b) scarto interquartile: Q = Q3 – Q1
osservazioni:– lo scarto interquartile individua il range del 50% della distribuzione centrata sulla mediana (il secondo quartile…)
u.s. 2 3 4 … … 4 8 14 … … 26 27 29
modalità 18 18 18 … … 20 20 20 … … 21 21 21
(posizione) (1) (2) (3) … …(14) (15) (16)… … (27) (28) (29)
Q1 Q2 Q3
18 20 21
25% 25% 25% 25%
50%
– maggiore è Q, maggiore sarà la dispersione
19 aprile 2008 7 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
3. scarto quadratico medio σ:
scarto: (xi – μ)
medio:
1
n
ii
x
n
2
1
2 2 2 219 19,5 18 19,5 18 19,5 ... 21 19,5
1,2529
n
ii
x x
n
quadratico: 2
1
n
ii
x
n
i (xi – )2 i (xi – )2 per qualsiasi
2
1
n
ii
x
n
19 aprile 2008 8 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
2
__2 21
n
ii
xx
n
__2 2 382,482 380,913 1,25x
osservazioni:− è nella stessa unità di misura dei dati (dipende dall’ordine di grandezza)
circa il 70% dei valori osservati dovrebbe cadere nell’intervallo μ ± σ σ ≥ 0 σ = 0 → omogeneità
− se si hanno le distribuzioni di frequenze lo sqm diventa:
2
21
1
n
i i ni
i ii
x x nx x f
n
19 aprile 2008 9 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
4. varianza σ2:quadrato dello sqm…
2
2 1
n
ii
x x
n
osservazioni: non è nella stessa unità di misura dei dati bensì il suo quadrato
(dipende dall’ordine di grandezza)
σ2 ≥ 0 σ2 = 0 omogeneità
__2 2 2x
poco informativa nell’analisi monovariata se si hanno le distribuzioni di frequenze :
2
22 1
1
n
i i ni
i ii
x x nx x f
n
19 aprile 2008 10 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
2
2 1
2 2 2 219 19,5 18 19,5 18 19,5 ... 21 19,5
1,5629
n
ii
x x
n
sigarette/h ni Età ni
1 6 18 10
2 15 19 3
3 5 20 7
4 3 21 9
totale 29 Totale 29
qual è la variabile che presenta maggiore variabilità?
σetà = 1,249 σsig =
19 aprile 2008 11 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
__2 2x x
1
m
i ii
x nx
n
2__
2 1
m
i ii
x nx
n
sigarette/h ni
1 6
2 15
3 5
4 3
Tot 29
xini
6
30
15
12
63
Media 2,172
xi2
1
4
9
16
xi2ni
6
60
45
48
159
5,483
σ 0,875
σetà = 1,249 σsig = 0,875
ordini di grandezza differenti, unità di misura diverse, appartenenza a gruppi di numerosità differente…
→ confronto?
19 aprile 2008 12 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
coefficiente di variazione (CV):
XXCV
→ numero puro!
sig/h Età
σ 0,875 1,249
Media 2,172 19,517
CV 0,403 0,064
18 180
18 180
20 200
21 210
22 220
17 170
15 150
σ 2,429972 24,29972
σ25,904764 590,4764
19 aprile 2008 13 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
Raggruppamento in classi
Esigenze di sintesi rendono oneroso e di poca rilevanza elencare tutte le modalità con rispettive frequenze
modalità → intervalli di valori → classi
Es.:
• u.s.: paziente• variabile: età• unità di misura: anni• numerosità gruppo: 1738
19 aprile 2008 14 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
età ni
15 1
17 7
18 18
19 18
… …
97 1
99 1
Totale 1738
0
10
20
30
40
50
60
70
15
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
89
91
92
94
95
96
97
99
Età
ni
19 aprile 2008 15 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
classe: intervallo di valori entro il quale si distribuiscono le osservazioni
• procedura (semplificata):– si determina il range: r = max – min– si sceglie il numero di classi = k– si divide il range (r* un po’ più ampio
di quello calcolato) per il numero di classi → si ottiene l’ampiezza di ogni classe d
– 1° classe: inf < min sup = est. inf. + d
2° classe: inf. = sup.1° + 1
sup. = est. inf. + d
ecc...
19 aprile 2008 16 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
• min=15• max=99• r=84• k=4• r*=88• d=r*/k=22• 1° classe : inf = 14 → sup = 14+22=36• 2° classe : inf = 36+1=37 → sup = 37+22=59
Classi di Età
inf sup
14 36
37 59
60 82
83 105
19 aprile 2008 17 / 17
Master in Neuropsicologia Clinica Elementi di Statistica I
→ distribuzione di frequenze per le classi...
Classi di età
ni fi Ni Fi
14-36 571 0,328 571 0,328
37-59 821 0,472 1392 0,800
60-82 333 0,192 1725 0,992
83-105 13 0,008 1738 1,000
Totale 1738 1,000
osservazioni:• è più conveniente considerare ampiezze costanti
• da tale distribuzione non è possibile identificare la reale distribuzione originaria…