Ikke parametriske tests - person.hst.aau.dk parametriske... · Mann Whitney U test (Wilcoxon’s...

47
Ikke-parametriske tests

Transcript of Ikke parametriske tests - person.hst.aau.dk parametriske... · Mann Whitney U test (Wilcoxon’s...

Ikke-parametriske tests

Dagens menu

t – testen… Hvordan var det nu lige det var? Wilcoxson Mann – Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation

2

t-testen

Patient Drug Placebo difference 1,00 19,00 22,00 -3,00 2,00 11,00 18,00 -7,00 3,00 14,00 17,00 -3,00 4,00 17,00 19,00 -2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00 -1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00 -8,00 10,00 8,00 7,00 1,00

3

t-testen

Men er data normal fordelte? Vi spørger SPSS! – Table 4-1 Armitage

4

t-testen. Er data normalfordelte?

Tests of Normality

Kolmogorov-Smirnova Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

drug ,191 10 ,200* ,954 10 ,715

placebo ,172 10 ,200* ,936 10 ,509

a. Lilliefors Significance Correction

*. This is a lower bound of the true significance.

5

t-testens begrænsninger

• Hvis vi tvivler på normalfordeling • Hvis vores outcome (dependent variable) er ordinal (ordnet kategorisk)

fx ’--’, ’-’, ’0’, ’+’, ’++’ • Hvis vi kan nøjes med en simpel metode

6

The sign test

• Den non-parametriske version af one-sample t-test • H0 for One-sample t-test: Middelværdien er 0 • H0 for sign testen: Fordelingen er symmetrisk omkring 0

7

The sign test

Patient Drug Placebo difference Sign 1,00 19,00 22,00 -3,00 - 2,00 11,00 18,00 -7,00 - 3,00 14,00 17,00 -3,00 - 4,00 17,00 19,00 -2,00 - 5,00 23,00 22,00 1,00 + 6,00 11,00 12,00 -1,00 - 7,00 15,00 14,00 1,00 + 8,00 19,00 11,00 8,00 + 9,00 11,00 19,00 -8,00 - 10,00 8,00 7,00 1,00 +

8

• Er der lige mange plusser og minusser?

• Der er 4 plusser og 6 minusser. • Binomial fordelingen fortæller om

sandsynligheden for at få 4 plusser ud af 10 mulige.

• 𝑝 𝑟,𝑛 = 𝑛!𝑟! 𝑛−𝑟 !

12

𝑟 12

𝑛−𝑟

• 𝑝 4,10 = 10!4! 6 !

12

4 12

6= 0.21

• p = 𝑝 4,10 + 𝑝 3,10 +𝑝 2,10 + 𝑝 1,10 + 𝑝 0,10 =0.21 + 0.12 + 0.04 + 0.01 +0.001 = 0.38 (One sided!)

The sign test in SPSS

9

The sign test in SPSS – the fancy dialog

10

The sign test

Binomial Test

Category N

Observed

Prop. Test Prop.

Exact Sig. (2-

tailed)

difference Group 1 <= 0 6 ,60 ,50 ,754

Group 2 > 0 4 ,40

Total 10 1,00

11

• Det er altså ikke særligt usandsynligt at observere 4 eller mindre minusser ud af 10 mulige

Men fortegnet beskriver jo ikke hele forskellen…

Patient Drug Placebo difference 1,00 19,00 22,00 -3,00 2,00 11,00 18,00 -7,00 3,00 14,00 17,00 -3,00 4,00 17,00 19,00 -2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00 -1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00 -8,00 10,00 8,00 7,00 1,00

12

• Hvis fx de negative værdier er større end de positive

• Wilcoxon’s signed rank sum test Tager højde for det

Wilcoxon’s signed rank sum test

difference -3,00 -7,00 -3,00 -2,00 1,00 -1,00 1,00 8,00 -8,00 1,00

13

• Opstil tallene efter størrelse uden at tage hensyn til fortegnet, men noter det blot

• Hvis flere tal har samme rank, bruges den gennemsnitlige rank • Plussernes hhv. minussernes rank summeres

• T+ = 2,5+2,5+2,5+9,5 = 17 • T- = 2,5+5+6,5+6,5+8+9,5 = 38

1 2 3 4 5 6 7 8 9 10 Rank 2.5 5 6.5 8 9.5

Numerical value 1 1 1 1 2 3 3 7 8 8 sign + - + + - - - - + -

Wilcoxon’s signed rank sum test

Der slås op i tabel for at se om ranken af den mindste er lille.

14

Wilcoxon’s signed rank sum test

15

Wilcoxon’s signed rank sum test –the fancy version

16

Wilcoxon’s signed rank sum test

Ranks

N Mean Rank Sum of Ranks

placebo - drug Negative Ranks 4a 4,25 17,00

Positive Ranks 6b 6,33 38,00

Ties 0c

Total 10

a. placebo < drug

b. placebo > drug

c. placebo = drug

17

Test Statisticsb

placebo - drug

Z -1,079a

Asymp. Sig. (2-tailed) ,281

a. Based on negative ranks.

b. Wilcoxon Signed Ranks Test

• Use Wilcoxon’s signed rank sum test to test if there is a statistical difference between the number of attacks in the placebo and the Pronethaol groups

Pause Opgave

Patient number # attack on placebo Pronethaol

1 71 29 2 323 348 3 8 1 4 14 7 5 23 16 6 34 25 7 79 65 8 60 41 9 2 0 10 3 0 11 17 15 12 7 2

18

Sammenligning mellem to uafhængige grupper

Mann Whitney U test Eller Wilcoxon’s rank sum test Eller Kendall’s S test t-testen for ikke-parametrisk data

19

Mann Whitney U (Wilcoxon’s metode) test

H0: Fordelingerne som de to grupper stammer fra er identiske Sådan gør man: ovnen tændes på 200C 1. Opstil tallene fra begge grupper i rækkefølge (Ranking) 2. Beregn summen af rank’ene for hver gruppe 3. Tæl antallet af tal i hver gruppe 4. Se om den mindste rank sum er mindre end den der er opgivet i tabel A8

20

Mann Whitney U test (Wilcoxon’s metode) - I hånden

High Protein

Low Protein

134,00 70,00 146,00 118,00 104,00 101,00 119,00 85,00 124,00 107,00 161,00 132,00 107,00 94,00 83,00

113,00 129,00 97,00

123,00

21

Mann Whitney U test (Wilcoxon’s metode) - I hånden

22

Mann Whitney U test (Wilcoxon’s metode) - I SPSS

Tabel 4-2 Armitage Bemærk opsætningen af data!

23

Mann Whitney U test (Wilcoxon’s metode) - I SPSS

Bemærk at man skal definere gruppe inddelingen!

24

Mann Whitney U test - I SPSS

25

Mann Whitney U test - I SPSS

Ranks

group N Mean Rank Sum of Ranks

Weight low 7 7,07 49,50

high 12 11,71 140,50

Total 19

26

Test Statisticsb

Weight

Mann-Whitney U 21,500

Wilcoxon W 49,500

Z -1,733

Asymp. Sig. (2-tailed) ,083

Exact Sig. [2*(1-tailed Sig.)] ,083a

a. Not corrected for ties.

b. Grouping Variable: group

Sammenligning af flere usammenhængende grupper

Kruskal-Wallis test H0: Fordelingerne som gruppere stammer fra er identiske En-vejs ANOVA for parametrisk data

28

Kruskal-Wallis test

Et par definitioner: k er antallet af grupper ni antallet af observationer i den i’te gruppe N er det samlede antal observationer Ri summen af ranks i den i’te gruppe Sådan gør man: Rank alle observationer Beregn rank summen for hver gruppe Beregn H (Det der i bogen kaldes T) Dette H er en chi-kvadrat fordeling med k-1 frihedsgræder Slå p-værdien op i en tabel

29

( ) ( )131

122

+−+

= ∑ NNN

H ii

nT

Kruskal-Wallis test – Et eksampel fra Armitage

30

Kruskal-Wallis test – Et eksampel

De rå data rankes

31

Kruskal-Wallis test – Et eksampel

De rå data rankes H beregnes

32

( )( ) ( )

2,6632,692132120

242212

120312020

57936534212

2222

=−=⋅−⋅

⋅=

+−+

+++=H

( ) ( )131

122

+−+

= ∑ NNN

H ii

nT

Kruskal-Wallis test – Et eksampel

De rå data rankes H = 6,2 Antallet af frihedsgrader = k-1 = 3

33

Kruskal-Wallis test – i SPSS

34

Kruskal-Wallis test – i SPSS

35

Kruskal-Wallis test – i SPSS

36

Kruskal-Wallis test – i SPSS

Ranks

group N Mean Rank

count 1,00 5 8,40

2,00 5 10,60

3,00 5 7,20

4,00 5 15,80

Total 20

37

Test Statisticsa,b

count

Chi-Square 6,205

df 3

Asymp. Sig. ,102

a. Kruskal Wallis Test

b. Grouping Variable:

group

Sammenligning af flere sammenhængende grupper

Friedman’s test Repeated ANOVA for parametrisk data

38

Friedman’s test Table 8.3 from Armitage

39

Friedman’s test

Ranks

Mean Rank

T1 1,38

T2 2,00

T3 2,94

T4 3,69

40

Test Statisticsa

N 8

Chi-Square 15,152

df 3

Asymp. Sig. ,002

a. Friedman Test

Friedman’s test

41

Pause opgave?

42

• Er der forskel på grisebassernes vægt i de forskellige fodergrupper?

Ranked Correlation

Kendall’s τ Spearman’s rs Korrelation koefficienten er mellem -1 og 1. Hvor -1 er perfekt omvendt korrelation, 0 betyder ingen korrelation, og 1 betyder

perfekt korrelation. Pearson is the correlation method for normal data Remember the assumptions: 1. Dependent variable must be metric continuous 2. Independent must be continuous or ordinal 3. Linear relationship between dependent and all independent variables 4. Residuals must have a constant spread. 5. Residuals are normal distributed

43

Kendall’s τ - Et eksempel

44

Kendall’s τ - Et eksempel

45

( )121 −

=nnSτ QPS −=

Spearman – det samme eksempel

d2 1 4 9 1 1 1 9 9 1 16

46

0.68481010

52616

1 33

2

=−⋅

−=−

−= ∑nn

drs

Korrelation i SPSS

47

Korrelation i SPSS

Correlations

a b

a Pearson

Correlation

1 ,685*

Sig. (2-tailed) ,029

N 10 10

b Pearson

Correlation

,685* 1

Sig. (2-tailed) ,029

N 10 10

*. Correlation is significant at the 0.05 level (2-tailed).

48

Correlations

a b

Kendall's tau_b a Correlation

Coefficient

1,000 ,511*

Sig. (2-tailed) . ,040

N 10 10

b Correlation

Coefficient

,511* 1,000

Sig. (2-tailed) ,040 .

N 10 10

Spearman's rho a Correlation

Coefficient

1,000 ,685*

Sig. (2-tailed) . ,029

N 10 10

b Correlation

Coefficient

,685* 1,000

Sig. (2-tailed) ,029 .

N 10 10

*. Correlation is significant at the 0.05 level (2-tailed).