ANOVA BETWEEN
description
Transcript of ANOVA BETWEEN
ANOVA BETWEEN
ANOVA BETWEEN – Introduzione
l’ANOVA BETWEEN è un’estensione del test T per il confronto tra medie di due campioni indipendenti
Variabile indipendente
una due più di due
Variab
ile dip
end
ente
Anova univariata a
una via
Anova univariata a
due vie
Anova univariata a
più vieuna
Anova bivariata a
una via
Anova bivariata a
due vie
Anova bivariata a
più viedue
Anova multivariata
a una via
Anova multivariata
a due vie
Anova multivariata
a più vie
più di due
disegni fattoriali
Between subjects: c’è un diverso gruppo di soggetti per ogni livello della variabile indipendente
ANOVA BETWEEN
ANOVA BETWEEN – Terminologia
FATTORE/I: variabile/i indipendente/i
LIVELLI DEI FATTORI: numero di modalità di ogni variabile indipendente. Il numero di fattori determina il numero di gruppi k.
ESEMPIOESEMPIO
ANOVA A 1 VIA: variabile indipendente “sesso” 2 livelli (“maschio” e “femmina”)
ANOVA A 2 VIE: variabili indipendenti “sesso” e “età” 3 livelli (“giovane”, “adulto”, “anziano”) ESEMPIOESEMPIO
EFFETTI PRINCIPALI: medie della variabile dipendente per ogni livello (“maschio”, “femmina”, giovane”, “adulto”, “anziano”)
INTERAZIONI: medie della variabile dipendente per ogni cella di incrocio dei livelli (“maschio*giovane”, “maschio*adulto”, “maschio*anziano”, “femmina*giovane”, “femmina*adulto”, “femmina*anziano”)
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
Gruppo A Gruppo B
Media Gruppo A
Media Gruppo B
Gruppo C
Media Gruppo C
Variabile indipendente XVariabile indipendente X
Variabile dipendente Y Variabile dipendente Y yij valore della variabile Y
per il soggetto i (i=1,…,nj) appartenente al gruppo j (j=1,..,k)
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
Gruppo A
Gruppo B
Gruppo C
ijjij yyyy )(
Le differenze TRA gruppi si misurano confrontando le medie di gruppo
con la media generale VARIABILITA’ TRA GRUPPI
Misura dell’effetto del trattamento
jyy
Le differenze NEI gruppi si misurano confrontando i valori dei singoli soggetti yij con la media del gruppo a cui appartengono
VARIABILITA’ NEI GRUPPI.ij rappresenta il fattore casuale (detto errore sperimentale): errore non
è sinonimo di sbaglio, ma indica l’effetto di uno o più fattori sconosciuti, comunque non valutati o non controllati nell'esperimento.
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
ijjij yyyy )(Gruppo A
Gruppo C
Gruppo B
jy
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
Gli errori εij:
devono essere tra loro indipendenti (il punteggio di un soggetto non deve essere correlato con quello di altri soggetti). L’assegnazione casuale dei soggetti alle diverse condizioni sperimentali fa in modo che le osservazioni non siano correlate – Coefficiente di correlazione interclasse per la valutazione dell’indipendenza,
devono essere distribuiti normalmente,le varianze dei vari gruppi devono essere omogenee
(omoschedasticità) – Test di Levene per la verifica dell’omoschedasticità,
gli effetti hanno una natura additiva
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
k
j
n
ijijj
k
j
k
jj
n
iij
jj
yynyyyy1
2
11
2
1
2
1
)()()(
Devianza totale Devianza TRA gruppi
(BETWEEN)
Devianza NEI gruppi
(WITHIN)
(k-1) gdl
j=1,2,…,k indice di gruppo i=1,2,…,nj indice dell’individuo
(n-k) gdl (n-1) gdl
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
H0: 1=2=…=k
(le popolazioni di provenienza dei campioni hanno medie uguali per la variabile dipendente Y)
H1: i ≠ j per almeno un i e un j (i≠j)
(almeno due campioni provengono da popolazioni con medie diverse)
)](),1[(
)(
)1(knk
Within
Between
F
kn
Devk
Dev
Statistica Test F di Snedecor
F(1,2) F(2,4)
F(5,10) F(10,50)
La zona di rifiuto dell’ipotesi nulla è sempre
nella coda di destra.
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
Lo studio investiga l’effetto che il mascheramento di un testimone ha sulla memoria e sulla percezione dei giurati rispetto alla testimonianza dello stesso testimone.
Fattore between:Fattore between: “Presentation condition” con 4 livelli “unmasked” (non mascherato), “greyblob” (punto grigio), “pixelated” (diviso in pixel), “negated” (nero e bianco invertiti).
Variabile dipendente:Variabile dipendente: percentuale di fatti raccontati dai testimoni e ricordati dai giurati
L’ipotesi è che ci potrebbe essere un effetto negativo del mascheramento sulla memoria.H0: unmasked=greyblob=pixelated=negated
H1: i ≠ j per almeno un i e un j (i≠j)
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
ANALYZE → COMPARE MEANS → ONE WAY ANOVA
In DEPENDENT LIST inserire la variabile dipendente
In FACTOR inserire la variabile indipendente
In OPTIONS selezionare Descriptive e Homogeneity of variance test Descriptives
MEMORY
10 66.70 5.334 1.687 62.88 70.52 58 75
10 55.70 3.802 1.202 52.98 58.42 48 61
10 57.70 5.417 1.713 53.82 61.58 51 68
10 67.20 4.590 1.451 63.92 70.48 58 74
40 61.83 7.001 1.107 59.59 64.06 48 75
unmasked
greyblob
pixelated
negated
Total
N Mean Std. Deviation Std. Error Lower Bound Upper Bound
95% Confidence Interval forMean
Minimum Maximum
Medie di gruppoNumerosità di
gruppo
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
ANOVA
MEMORY
1071.875 3 357.292 15.314 .000
839.900 36 23.331
1911.775 39
Between Groups
Within Groups
Total
Sum ofSquares df Mean Square F Sig.
Devianze
Gradi di libertà
Varianze=Devianze/gdl
Valore sperimentale= valore della statistica test (F di Snedecor)
P-value
p-value < → rifiuto
l’ipotesi nulla
Il mascheramento ha un effetto
significativo sulla memoria.
Test of Homogeneity of Variances
MEMORY
.490 3 36 .692
LeveneStatistic df1 df2 Sig.
Test di Levene:
H0: omoschedasticità
H1: eteroschedasticità
P-value> accetto ipotesi nulla
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
Se nel confronto tra le medie di k gruppi con il test F è stata rifiutata l’ipotesi
nulla H0: 1=2=…=k si pone il problema di verificare tra quali medie esista
una differenza significativa.
I confronti multipli a posteriori (confronti non pianificati, post hoc comparisons) sono utili quando non è possibile programmare i confronti a priori per mancanza di informazioni. Si effettuano, quindi, tutti i possibili confronti tra le medie alla ricerca di quelle differenze che hanno determinato la significatività totale (ogni media viene confrontata tra tutte le altre).Per questi confronti sono stati proposti diversi metodi che, come impostazione logica, derivano dal test T di Student per ipotesi bidirezionali. Il ricercatore tenderà a scegliere il test post hoc che garantisce la potenza del test maggiore (1-=p(rifiutare H0/H1 è vera)) senza tuttavia dimenticare il problema legato all’errore di primo tipo (vedi disuguaglianza di Bonferroni):
pi
TOT
p=numero di confronti tra medie
i=significatività di ogni confronto post hoc
ANALYZE → COMPARE MEANS → ONE WAY ANOVA
In POST HOC selezionare TUKEY e BONFERRONI
ANOVA BETWEEN
ANOVA BETWEEN – A UNA VIA
Multiple Comparisons
Dependent Variable: MEMORY
11.00* 2.160 .000 5.18 16.82
9.00* 2.160 .001 3.18 14.82
-.50 2.160 .996 -6.32 5.32
-11.00* 2.160 .000 -16.82 -5.18
-2.00 2.160 .791 -7.82 3.82
-11.50* 2.160 .000 -17.32 -5.68
-9.00* 2.160 .001 -14.82 -3.18
2.00 2.160 .791 -3.82 7.82
-9.50* 2.160 .001 -15.32 -3.68
.50 2.160 .996 -5.32 6.32
11.50* 2.160 .000 5.68 17.32
9.50* 2.160 .001 3.68 15.32
11.00* 2.160 .000 4.97 17.03
9.00* 2.160 .001 2.97 15.03
-.50 2.160 1.000 -6.53 5.53
-11.00* 2.160 .000 -17.03 -4.97
-2.00 2.160 1.000 -8.03 4.03
-11.50* 2.160 .000 -17.53 -5.47
-9.00* 2.160 .001 -15.03 -2.97
2.00 2.160 1.000 -4.03 8.03
-9.50* 2.160 .001 -15.53 -3.47
.50 2.160 1.000 -5.53 6.53
11.50* 2.160 .000 5.47 17.53
9.50* 2.160 .001 3.47 15.53
(J) Presentation conditiongreyblob
pixelated
negated
unmasked
pixelated
negated
unmasked
greyblob
negated
unmasked
greyblob
pixelated
greyblob
pixelated
negated
unmasked
pixelated
negated
unmasked
greyblob
negated
unmasked
greyblob
pixelated
(I) Presentation conditionunmasked
greyblob
pixelated
negated
unmasked
greyblob
pixelated
negated
Tukey HSD
Bonferroni
MeanDifference
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
H0: differenza medie nulla; H1: differenza medie non nulla
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
EFFETTI
PRINCIPALI (indipendentemente dai valori delle altre variabili indipendenti)INTERAZIONI (l’effetto di una variabile indipendente sulla variabile dipendente non è uguale per tutti i livelli delle altre variabili indipendenti)
IPOTESI
Un’ipotesi per ogni fattore principale (ipotesi sulle medie)
Un’ipotesi per le interazioni (ipotesi sulle differenze di medie)
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
ANOVA A 2 VIE 2 FATTORI
A con 4 livelli (a, b, c, d)
B con 5 livelli (1, 2, 3, 4, 5)
IPOTESI
Per il fattore A H0: µa = µb = µc = µd
H1: almeno una coppia di medie diversa
Per l’interazione A*B H0: (µ1-µ2)a = (µ1-µ3)a = …= (µ1-µ2)b =(µ1-µ3)b=…= (µ1-µ2)c= (µ1-µ3)c=…
Per il fattore B H0: µ1 = µ2 = µ3 = µ4 = µ5
H1: almeno una coppia di medie diversa
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
ijy
jy.
Valore della variabile Y per il soggetto i (i=1,…,n) appartenente al livello j (j=1,…k)
.iy
Media della variabile Y per il livello j (j=1,…k) - media di colonna -
Media della variabile Y per il soggetto i (i=1,…n) - media di riga -
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
DEVIANZA TOTALE
DEVIANZA NEI GRUPPI DEVIANZA TRA I GRUPPI
DEVIANZA EFFETTO
PRINCIPALE 1°FATTORE
DEVIANZA EFFETTO
PRINCIPALE 2°FATTORE
DEVIANZA EFFETTO
INTERAZIONE
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
(n-1)
n-(k1*k2) DEVIANZA TRA I GRUPPI
(k1-1) (k2-1)
(k1-1)*(k2-1)
k1= livelli del 1°fattore
k2=livelli del 2°fattore
Si costruiscono 3 test F del tipo
gdlDevgdlDev
NEI
TRA
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
Lo studio considera l’effetto che il fascino e il genere dell’imputato possono esercitare sulla giuria durante un processo. Nello studio in esame viene consegnata a 60 persone la testimonianza (sotto forma di testo scritto) di un ipotetico imputato con la descrizione dell’omicidio commesso. 20 persone ricevono solamente la testimonianza scritta, 20 persone la testimonianza scritta e una fotografia di un imputato affascinante e, infine, 20 persone ricevono la testimonianza scritta e una fotografia di un imputato non affascinante. (La fotografia può essere indifferentemente di un uomo o di una donna). Ai partecipanti viene chiesto di indicare quanti anni di prigione l’imputato dovrebbe scontare come punizione.
Fattore between 1:Fattore between 1: “Attractiveness” con 3 livelli “attractive”, “unattractive”, “no picture”.
Fattore between 2: Fattore between 2: “Sex differences” con 2 livelli “same sex as defendant” e “opposite sex as defendent” (indicato nella testimonianza scritta o nella fotografia).
Variabile dipendente:Variabile dipendente: sentenza data sotto forma di numero di anni da scontare in carcere (minimo 3, massimo 25 anni).
L’ipotesi è che imputati non affascinanti ricevano pene più dure e che la durata delle pene dipenda anche dal genere dell’imputato.
File: twowaybetweenANOVA.sav
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
ANALYZE → GENERAL LINEAR MODEL → UNIVARIATE
In DEPENDENT VARIABLE inserire la variabile dipendente
In FIXED FACTORS inserire le variabili indipendenti
In OPTIONS selezionare Descriptive Statistics
Descriptive Statistics
Dependent Variable: Sentence
7.50 1.780 10
11.20 2.300 10
14.50 1.269 10
11.07 3.403 30
7.50 2.415 10
10.30 2.058 10
13.50 1.650 10
10.43 3.191 30
7.50 2.065 20
10.75 2.173 20
14.00 1.522 20
10.75 3.286 60
AttractivenessAttractive
Unattractive
No picture
Total
Attractive
Unattractive
No picture
Total
Attractive
Unattractive
No picture
Total
Sex DifferencesSame sex as defendant
Opposite sex asdefendant
Total
Mean Std. Deviation N
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
Between-Subjects Factors
Same sexasdefendant
30
Oppositesex asdefendant
30
Attractive 20
Unattractive 20
No picture 20
1
2
Sex Differences
1
2
3
Attractiveness
Value Label N
Nella prima tabella, SPSS riporta i fattori e i corrispondenti livelli nonché il numero di soggetti per ogni livello.
Sex Differences * Attractiveness
Sex Differences
Attractiveness
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
Tests of Between-Subjects Effects
Dependent Variable: Sentence
431.550a 5 86.310 22.658 .000
6933.750 1 6933.750 1820.236 .000
6.017 1 6.017 1.579 .214
422.500 2 211.250 55.457 .000
3.033 2 1.517 .398 .674
205.700 54 3.809
7571.000 60
637.250 59
SourceCorrected Model
Intercept
SEX
ATTRACT
SEX * ATTRACT
Error
Total
Corrected Total
Type III Sumof Squares df Mean Square F Sig.
R Squared = .677 (Adjusted R Squared = .647)a.
Effetti principali
Interazione
L’effetto principale della variabile genere (SEX) non è significativo (p-value 0.214). C’è una significatività nell’effetto principale della variabile fascino (ATTRACT) (p<0.0005). Non c’è interazione significativa tra i due fattori (p-value 0.674).
ANOVA BETWEEN
ANOVA BETWEEN – A DUE VIE
GRAPH → BAR → SIMPLE
In OTHER SUMMARY FUNCTION inserire la variabile dipendente
In CATEGORY AXIS inserire la variabile indipendente significativa
Attractiveness
No pictureUnattractiveAttractive
Me
an
Se
nte
nce
16
14
12
10
8
6