Analisi bivariata

23
17 maggio 2008 1 / 23 ter in Neuropsicologia Clinica Elementi di Statistic Analisi bivariata Per ogni unità statistica si considerano congiuntamente due variabili: u.s. 1 2 3 4 5 6 Età 25 32 41 28 51 29 Sesso M M F M M M Sesso ni fi F 48 0,24 M 152 0,76 Total e 200 1,00 Classi di età ni fi 18-29 32 0,1 6 30-41 52 0,2 6 42-53 60 0,3 0 54-65 26 0,1 3 66-77 20 0,1

description

Analisi bivariata. Per ogni unità statistica si considerano congiuntamente due variabili: u.s.123456… Età253241285129… SessoMMFMMM…. Perché?. Rappresentazione sintetica delle distribuzioni di due variabili / quantificazione di un fenomeno - PowerPoint PPT Presentation

Transcript of Analisi bivariata

Page 1: Analisi bivariata

17 maggio 2008 1 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Analisi bivariata

Per ogni unità statistica si considerano congiuntamente due variabili:

u.s. 1 2 3 4 5 6 …

Età 25 32 41 28 51 29 …

Sesso M M F M M M …

Sesso ni fi

F 48 0,24

M 152 0,76

Totale 200 1,00

Classi di età ni fi

18-29 32 0,16

30-41 52 0,26

42-53 60 0,30

54-65 26 0,13

66-77 20 0,10

78-89 8 0,04

90-101 2 0,01

Totale 200 1,00

Page 2: Analisi bivariata

17 maggio 2008 2 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Perché?

1. Rappresentazione sintetica delle distribuzioni di due variabili / quantificazione di un fenomeno

2. Valutazione dell’andamento congiunto delle due variabili

3. Valutazione della relazione causa-effetto tra le due variabili

Page 3: Analisi bivariata

17 maggio 2008 3 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Sesso

Classi di età F M Totale

18-29 8 24 32

30-41 15 37 52

42-53 11 49 60

54-65 7 19 26

66-77 3 17 20

78-89 3 5 8

90-101 1 1 2

Totale 48 152 200

Sesso

Classi di età F M Totale

18-29 0,040 0,120 0,160

30-41 0,075 0,185 0,260

42-53 0,055 0,245 0,300

54-65 0,035 0,095 0,130

66-77 0,015 0,085 0,100

78-89 0,015 0,025 0,040

90-101 0,005 0,005 0,010

Totale 0,240 0,760 1,000

Page 4: Analisi bivariata

17 maggio 2008 4 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

.1

k

j iji

n n

.1

h

i ijj

n n

. .1 1 1 1

k h k h

ij i ji j i j

n n n n

Distribuzione congiunta

Distribuzione marginale

Tabella a 2 vie k x h

Page 5: Analisi bivariata

17 maggio 2008 5 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Sesso

Classi di età F M Totale

18-29 8 24 32

30-41 15 37 52

42-53 11 49 60

54-65 7 19 26

66-77 3 17 20

78-89 3 5 8

90-101 1 1 2

Totale 48 152 200

Sesso

Classi di età F M Totale

18-29 0,167 0,158 0,160

30-41 0,313 0,243 0,260

42-53 0,229 0,322 0,300

54-65 0,146 0,125 0,130

66-77 0,062 0,112 0,100

78-89 0,062 0,033 0,040

90-101 0,021 0,007 0,010

Totale 1,000 1,000 1,000

Sesso

Classi di età F M Totale

18-29 0,250 0,750 1,000

30-41 0,288 0,712 1,000

42-53 0,183 0,817 1,000

54-65 0,269 0,731 1,000

66-77 0,150 0,850 1,000

78-89 0,375 0,625 1,000

90-101 0,500 0,500 1,000

Totale 0,240 0,760 1,000

Page 6: Analisi bivariata

17 maggio 2008 6 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Distribuzione condizionata di X a y1

Distribuzione condizionata di Y a x2

Page 7: Analisi bivariata

17 maggio 2008 7 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Relazione tra variabili• Forma: simmetrica X←→Y

asimmetrica X→Y (causa-effetto / indipendente-dipendente)

• Segno: variazione concorde X↑↓ Y ↑↓ +

variazione discorde X↑↓ Y ↓↑ -(var. almeno ordinali…)

• Forza:

Sovrappeso

Pressione

Totalebassa media alta

Sì 280 10 10 300

No 5 290 5 300

Totale 285 300 15 600

Sovrappeso

Pressione

Totalebassa media alta

Sì 180 60 60 300

No 50 200 50 300

Totale 230 260 110 600Sovrappes

o

Pressione

Totalebassa media alta

Sì 102 99 99 300

No 98 103 99 300

Totale 200 202 198 600

Page 8: Analisi bivariata

17 maggio 2008 8 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Rappresentazioni grafiche

18-29 30-41 42-53 54-65 66-77 78-89 90-101

FM

0

10

20

30

40

50

0

10

20

30

40

50

60

18-29 30-41 42-53 54-65 66-77 78-89 90-101

F

M

0

10

20

30

40

50

60

F M

18-29

30-41

42-53

54-65

66-77

78-89

90-101

Page 9: Analisi bivariata

17 maggio 2008 9 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

0

10

20

30

40

50

60

70

18-29 30-41 42-53 54-65 66-77 78-89 90-101

M

F

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

18-29 30-41 42-53 54-65 66-77 78-89 90-101

M

F

Page 10: Analisi bivariata

17 maggio 2008 10 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Cenni di Calcolo delle Probabilità

Definizione di probabilità

Intuitiva: p.e. lancio una moneta, qual è la probabilità che esce testa?

lancio un dado, qual è la probabilità che esce 5?

e che esce un numero pari?

e che esce 7?

e che esce un numero compreso tra 1 e 6?

Page 11: Analisi bivariata

17 maggio 2008 11 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Terminologia

Evento: manifestazione oggetto di attenzione

Evento casuale: il risultato dell’esperimento casuale, ovvero di una situazione in cui si è operata una scelta o si è manifestato un evento senza una precisa regola, in modo casuale.

certo – evento che si manifesta sicuramente

impossibile – evento che non si manifesta sicuramente

possibile – evento che si può manifestare

incompatibili – due (o più) eventi che non si possono verificare contemporaneamente

complementare – evento o insieme di eventi che si verifica in contrasto ad un altro

Spazio campionario Ω: l’insieme di tutti i possibili risultati

Page 12: Analisi bivariata

17 maggio 2008 12 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

• Definizione classica: (Pascal e Fermat, XVII sec.) La probabilità di un evento è il rapporto tra il numero dei casi favorevoli e il numero dei casi possibili, purché questi ultimi siano ugualmente possibili

Se su n casi nA sono quelli relativi al verificarsi dell’evento A, la probabilità che si verifichi A è:

• Qual è la probabilità di estrarre una pallina bianca da un’urna che contiene 3 palline bianche, 2 nere e 3 gialle?

n=8A=pallina bianca

nA=3

pA=3/8=0,375

AA

np P A

n

Page 13: Analisi bivariata

17 maggio 2008 13 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

• Definizione frequentista: Se si ripete un processo un gran numero di volte n e se un certo evento con caratteristica A si verifica nA volte, la frequenza relativa di successo di A è nA/n e sarà approssimativamente uguale alla probabilità di A.

Se su 1235 osservazioni rilevo per 371 volte la caratteristica ‘pressione bassa’, allora la probabilità di osservare un soggetto con ‘pressione bassa’ verosimilmente sarà

371/1235=0,300

AA

np P A

n

Page 14: Analisi bivariata

17 maggio 2008 14 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

• Definizione assiomatica:

1. Dato un processo che genera n risultati (eventi) mutuamente esclusivi, A1, A2, …, An, la probabilità di un dato evento Ai è data da un numero non negativo, ovvero: P(Ai) ≥ 0

2. La somma delle probabilità di tutti gli eventi mutuamente esclusivi è uguale a 1:

3. Dati due eventi mutuamente esclusivi, Ai e Aj, la probabilità che si verifichi o Ai o Aj è uguale alla somma delle singole probabilità:

P(Ai o Aj) = P(Ai) + P(Aj)

1

1n

ii

P A

Page 15: Analisi bivariata

17 maggio 2008 15 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Relazione con la tabella a 2 vie

Sesso

Classi di età F M Totale

18-29 8 24 32

30-41 15 37 52

42-53 11 49 60

54-65 7 19 26

66-77 3 17 20

78-89 3 5 8

90-101 1 1 2

Totale 48 152 200

1. Le modalità sono mutuamente esclusive2. Supp. uguale probabilità per ogni u.s.

1. P(F) = 0,24

2. P(54-65) = 0,13

3. P(42-53|M) = 0,322

4. P(30-41 ∩ F) = 0,075

1. e 2. → probabilità marginale

3. → probabilità condizionata

4. → probabilità congiunta

Simbologia:| → condizionamento∩ → intersezione → contemporaneità

(A e B ovvero B e A)U → unione → alternatività e contemp.

(A, B, oppure A e B)

Page 16: Analisi bivariata

17 maggio 2008 16 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Sesso

Classi di età F M Totale

18-29 8 24 32

30-41 15 37 52

42-53 11 49 60

54-65 7 19 26

66-77 3 17 20

78-89 3 5 8

90-101 1 1 2

Totale 48 152 200

P(F) = 0,24

P(54-65) = 0,13

P(54-65|F) = 0,146

P(F|54-65) = 0,269

P(54-65 ∩ F) = 0,035

0,035 = 0,24 x 0,146

P(54-65 ∩ F) = P(F) x P(54-65|F)

Legge del prodotto: P(A∩B) = P(B) x P(A|B) se P(B)≠0

Page 17: Analisi bivariata

17 maggio 2008 17 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Legge del prodotto: P(A∩B) = P(B) x P(A|B) se P(B)≠0

P(A∩B) P(A|B) = ----------- se P(B)≠0

P(B)

P(M o F) = P (M U F) = P(M) + P(F) = 0,76 + 0,24 = 1

Se non sono mutuamente esclusivi?? Es. M e 18-29…

Legge della somma: P(A U B) = P(A) + P(B) – P(A ∩ B)

Es. P(M U 18-24) = P(M) + P(18-29) – P(M ∩ 18-29) == 0,76 + 0,160 – 0,120 = 0,80 (152) (32) (24)

Sesso

Classi di età

F M Totale

18-29 8 24 32

30-41 15 37 52

42-53 11 49 60

54-65 7 19 26

66-77 3 17 20

78-89 3 5 8

90-101 1 1 2

Totale 48 152 200

Page 18: Analisi bivariata

17 maggio 2008 18 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Eventi indipendenti

Es. A = essere M B = avere le ali

P(B) non ha effetto su P(A) e viceversa → P(A|B) = P(A) P(B|A) = P(B)

P(A ∩ B) = P(B) x P(A|B) = P(B) x P(A)

Eventi complementari

Es. A = essere M il complementare è = essere F…

1P A P A

Page 19: Analisi bivariata

17 maggio 2008 19 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Variabile casuale: variabile i cui valori non possono essere esattamente predetti.

discreta: salti o interruzioni nei valori (conteggio…)

continua: non ha salti o interruzioni (altezza…) (limite strumento di misura)

Distribuzione di probabilità di V.C. discreta:

Specificazione di tutti i valori possibili con le rispettive probabilità…

Num. infarti ni pi pi

0 782 782/1464 0,534

1 389 389/1464 0,266

2 218 218/1464 0,149

3 75 75/1464 0,051

Totale 1464 1,000

pi ≡ fi

1. pi ≥ 0 per ogni i

2. ∑pi = 1

3. P(Ai o Aj) = pi + pj per ogni i e j

Page 20: Analisi bivariata

17 maggio 2008 20 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

graficamente…

0,000

0,100

0,200

0,300

0,400

0,5000,600

0,700

0,800

0,900

1,000

-1 0 1 2 3 4

Num. Infarti

pi

0,000

0,100

0,200

0,300

0,400

0,5000,600

0,700

0,800

0,900

1,000

-1 0 1 2 3 4

Num. Infarti

pi

Prob. Cumulata:

F(x) = P(X≤ x)

Page 21: Analisi bivariata

17 maggio 2008 21 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

graficamente…

0,000

0,100

0,200

0,300

0,400

0,5000,600

0,700

0,800

0,900

1,000

-1 0 1 2 3 4

Num. Infarti

pi

0

0,2

0,4

0,6

0,8

1

1,2

0 1 2 3 4 5

Prob. Cumulata:

F(x) = P(X≤ x)

Num. infarti ni pi F(x)

0 782 0,534 0,534

1 389 0,266 0,800

2 218 0,149 0,949

3 75 0,051 1,00

Totale 1464 1,000

Page 22: Analisi bivariata

17 maggio 2008 22 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

Distribuzione di probabilità continue

26 28 30 32 34 36 38 40

E tà

0

2

4

6

8

10

12

14

16

18

20

n i

26 28 30 32 34 36 38 40

E tà

0

2

4

6

8

10

12

14

16

18

20

n i

n → ∞d → 0

Area = 1

Page 23: Analisi bivariata

17 maggio 2008 23 / 23

Master in Neuropsicologia Clinica Elementi di Statistica I

fa-b

funzione di densità per X v.c. continua:1. f(x) ≥ 02. Area = 13. Area (a-b) = P(a ≤ X ≤ b)