Analisi bivariata
description
Transcript of Analisi bivariata
17 maggio 2008 1 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Analisi bivariata
Per ogni unità statistica si considerano congiuntamente due variabili:
u.s. 1 2 3 4 5 6 …
Età 25 32 41 28 51 29 …
Sesso M M F M M M …
Sesso ni fi
F 48 0,24
M 152 0,76
Totale 200 1,00
Classi di età ni fi
18-29 32 0,16
30-41 52 0,26
42-53 60 0,30
54-65 26 0,13
66-77 20 0,10
78-89 8 0,04
90-101 2 0,01
Totale 200 1,00
17 maggio 2008 2 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Perché?
1. Rappresentazione sintetica delle distribuzioni di due variabili / quantificazione di un fenomeno
2. Valutazione dell’andamento congiunto delle due variabili
3. Valutazione della relazione causa-effetto tra le due variabili
17 maggio 2008 3 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Sesso
Classi di età F M Totale
18-29 8 24 32
30-41 15 37 52
42-53 11 49 60
54-65 7 19 26
66-77 3 17 20
78-89 3 5 8
90-101 1 1 2
Totale 48 152 200
Sesso
Classi di età F M Totale
18-29 0,040 0,120 0,160
30-41 0,075 0,185 0,260
42-53 0,055 0,245 0,300
54-65 0,035 0,095 0,130
66-77 0,015 0,085 0,100
78-89 0,015 0,025 0,040
90-101 0,005 0,005 0,010
Totale 0,240 0,760 1,000
17 maggio 2008 4 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
.1
k
j iji
n n
.1
h
i ijj
n n
. .1 1 1 1
k h k h
ij i ji j i j
n n n n
Distribuzione congiunta
Distribuzione marginale
Tabella a 2 vie k x h
17 maggio 2008 5 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Sesso
Classi di età F M Totale
18-29 8 24 32
30-41 15 37 52
42-53 11 49 60
54-65 7 19 26
66-77 3 17 20
78-89 3 5 8
90-101 1 1 2
Totale 48 152 200
Sesso
Classi di età F M Totale
18-29 0,167 0,158 0,160
30-41 0,313 0,243 0,260
42-53 0,229 0,322 0,300
54-65 0,146 0,125 0,130
66-77 0,062 0,112 0,100
78-89 0,062 0,033 0,040
90-101 0,021 0,007 0,010
Totale 1,000 1,000 1,000
Sesso
Classi di età F M Totale
18-29 0,250 0,750 1,000
30-41 0,288 0,712 1,000
42-53 0,183 0,817 1,000
54-65 0,269 0,731 1,000
66-77 0,150 0,850 1,000
78-89 0,375 0,625 1,000
90-101 0,500 0,500 1,000
Totale 0,240 0,760 1,000
17 maggio 2008 6 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Distribuzione condizionata di X a y1
Distribuzione condizionata di Y a x2
17 maggio 2008 7 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Relazione tra variabili• Forma: simmetrica X←→Y
asimmetrica X→Y (causa-effetto / indipendente-dipendente)
• Segno: variazione concorde X↑↓ Y ↑↓ +
variazione discorde X↑↓ Y ↓↑ -(var. almeno ordinali…)
• Forza:
Sovrappeso
Pressione
Totalebassa media alta
Sì 280 10 10 300
No 5 290 5 300
Totale 285 300 15 600
Sovrappeso
Pressione
Totalebassa media alta
Sì 180 60 60 300
No 50 200 50 300
Totale 230 260 110 600Sovrappes
o
Pressione
Totalebassa media alta
Sì 102 99 99 300
No 98 103 99 300
Totale 200 202 198 600
17 maggio 2008 8 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Rappresentazioni grafiche
18-29 30-41 42-53 54-65 66-77 78-89 90-101
FM
0
10
20
30
40
50
0
10
20
30
40
50
60
18-29 30-41 42-53 54-65 66-77 78-89 90-101
F
M
0
10
20
30
40
50
60
F M
18-29
30-41
42-53
54-65
66-77
78-89
90-101
17 maggio 2008 9 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
0
10
20
30
40
50
60
70
18-29 30-41 42-53 54-65 66-77 78-89 90-101
M
F
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
18-29 30-41 42-53 54-65 66-77 78-89 90-101
M
F
17 maggio 2008 10 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Cenni di Calcolo delle Probabilità
Definizione di probabilità
Intuitiva: p.e. lancio una moneta, qual è la probabilità che esce testa?
lancio un dado, qual è la probabilità che esce 5?
e che esce un numero pari?
e che esce 7?
e che esce un numero compreso tra 1 e 6?
17 maggio 2008 11 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Terminologia
Evento: manifestazione oggetto di attenzione
Evento casuale: il risultato dell’esperimento casuale, ovvero di una situazione in cui si è operata una scelta o si è manifestato un evento senza una precisa regola, in modo casuale.
certo – evento che si manifesta sicuramente
impossibile – evento che non si manifesta sicuramente
possibile – evento che si può manifestare
incompatibili – due (o più) eventi che non si possono verificare contemporaneamente
complementare – evento o insieme di eventi che si verifica in contrasto ad un altro
Spazio campionario Ω: l’insieme di tutti i possibili risultati
17 maggio 2008 12 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
• Definizione classica: (Pascal e Fermat, XVII sec.) La probabilità di un evento è il rapporto tra il numero dei casi favorevoli e il numero dei casi possibili, purché questi ultimi siano ugualmente possibili
Se su n casi nA sono quelli relativi al verificarsi dell’evento A, la probabilità che si verifichi A è:
• Qual è la probabilità di estrarre una pallina bianca da un’urna che contiene 3 palline bianche, 2 nere e 3 gialle?
n=8A=pallina bianca
nA=3
pA=3/8=0,375
AA
np P A
n
17 maggio 2008 13 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
• Definizione frequentista: Se si ripete un processo un gran numero di volte n e se un certo evento con caratteristica A si verifica nA volte, la frequenza relativa di successo di A è nA/n e sarà approssimativamente uguale alla probabilità di A.
Se su 1235 osservazioni rilevo per 371 volte la caratteristica ‘pressione bassa’, allora la probabilità di osservare un soggetto con ‘pressione bassa’ verosimilmente sarà
371/1235=0,300
AA
np P A
n
17 maggio 2008 14 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
• Definizione assiomatica:
1. Dato un processo che genera n risultati (eventi) mutuamente esclusivi, A1, A2, …, An, la probabilità di un dato evento Ai è data da un numero non negativo, ovvero: P(Ai) ≥ 0
2. La somma delle probabilità di tutti gli eventi mutuamente esclusivi è uguale a 1:
3. Dati due eventi mutuamente esclusivi, Ai e Aj, la probabilità che si verifichi o Ai o Aj è uguale alla somma delle singole probabilità:
P(Ai o Aj) = P(Ai) + P(Aj)
1
1n
ii
P A
17 maggio 2008 15 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Relazione con la tabella a 2 vie
Sesso
Classi di età F M Totale
18-29 8 24 32
30-41 15 37 52
42-53 11 49 60
54-65 7 19 26
66-77 3 17 20
78-89 3 5 8
90-101 1 1 2
Totale 48 152 200
1. Le modalità sono mutuamente esclusive2. Supp. uguale probabilità per ogni u.s.
1. P(F) = 0,24
2. P(54-65) = 0,13
3. P(42-53|M) = 0,322
4. P(30-41 ∩ F) = 0,075
1. e 2. → probabilità marginale
3. → probabilità condizionata
4. → probabilità congiunta
Simbologia:| → condizionamento∩ → intersezione → contemporaneità
(A e B ovvero B e A)U → unione → alternatività e contemp.
(A, B, oppure A e B)
17 maggio 2008 16 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Sesso
Classi di età F M Totale
18-29 8 24 32
30-41 15 37 52
42-53 11 49 60
54-65 7 19 26
66-77 3 17 20
78-89 3 5 8
90-101 1 1 2
Totale 48 152 200
P(F) = 0,24
P(54-65) = 0,13
P(54-65|F) = 0,146
P(F|54-65) = 0,269
P(54-65 ∩ F) = 0,035
0,035 = 0,24 x 0,146
P(54-65 ∩ F) = P(F) x P(54-65|F)
Legge del prodotto: P(A∩B) = P(B) x P(A|B) se P(B)≠0
17 maggio 2008 17 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Legge del prodotto: P(A∩B) = P(B) x P(A|B) se P(B)≠0
P(A∩B) P(A|B) = ----------- se P(B)≠0
P(B)
P(M o F) = P (M U F) = P(M) + P(F) = 0,76 + 0,24 = 1
Se non sono mutuamente esclusivi?? Es. M e 18-29…
Legge della somma: P(A U B) = P(A) + P(B) – P(A ∩ B)
Es. P(M U 18-24) = P(M) + P(18-29) – P(M ∩ 18-29) == 0,76 + 0,160 – 0,120 = 0,80 (152) (32) (24)
Sesso
Classi di età
F M Totale
18-29 8 24 32
30-41 15 37 52
42-53 11 49 60
54-65 7 19 26
66-77 3 17 20
78-89 3 5 8
90-101 1 1 2
Totale 48 152 200
17 maggio 2008 18 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Eventi indipendenti
Es. A = essere M B = avere le ali
P(B) non ha effetto su P(A) e viceversa → P(A|B) = P(A) P(B|A) = P(B)
P(A ∩ B) = P(B) x P(A|B) = P(B) x P(A)
Eventi complementari
Es. A = essere M il complementare è = essere F…
1P A P A
17 maggio 2008 19 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Variabile casuale: variabile i cui valori non possono essere esattamente predetti.
discreta: salti o interruzioni nei valori (conteggio…)
continua: non ha salti o interruzioni (altezza…) (limite strumento di misura)
Distribuzione di probabilità di V.C. discreta:
Specificazione di tutti i valori possibili con le rispettive probabilità…
Num. infarti ni pi pi
0 782 782/1464 0,534
1 389 389/1464 0,266
2 218 218/1464 0,149
3 75 75/1464 0,051
Totale 1464 1,000
pi ≡ fi
1. pi ≥ 0 per ogni i
2. ∑pi = 1
3. P(Ai o Aj) = pi + pj per ogni i e j
17 maggio 2008 20 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
graficamente…
0,000
0,100
0,200
0,300
0,400
0,5000,600
0,700
0,800
0,900
1,000
-1 0 1 2 3 4
Num. Infarti
pi
0,000
0,100
0,200
0,300
0,400
0,5000,600
0,700
0,800
0,900
1,000
-1 0 1 2 3 4
Num. Infarti
pi
Prob. Cumulata:
F(x) = P(X≤ x)
17 maggio 2008 21 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
graficamente…
0,000
0,100
0,200
0,300
0,400
0,5000,600
0,700
0,800
0,900
1,000
-1 0 1 2 3 4
Num. Infarti
pi
0
0,2
0,4
0,6
0,8
1
1,2
0 1 2 3 4 5
Prob. Cumulata:
F(x) = P(X≤ x)
Num. infarti ni pi F(x)
0 782 0,534 0,534
1 389 0,266 0,800
2 218 0,149 0,949
3 75 0,051 1,00
Totale 1464 1,000
17 maggio 2008 22 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
Distribuzione di probabilità continue
26 28 30 32 34 36 38 40
E tà
0
2
4
6
8
10
12
14
16
18
20
n i
26 28 30 32 34 36 38 40
E tà
0
2
4
6
8
10
12
14
16
18
20
n i
n → ∞d → 0
Area = 1
17 maggio 2008 23 / 23
Master in Neuropsicologia Clinica Elementi di Statistica I
fa-b
funzione di densità per X v.c. continua:1. f(x) ≥ 02. Area = 13. Area (a-b) = P(a ≤ X ≤ b)