En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos...

36
Statistiska institutionen ───────────────────────────────────────────────────── En simuleringsstudie på sannolikhet för typ I-fel och styrka hos olika normalitetstest på avrundade data Höstterminen 2018 Jakob Gunnarsson & Arvid Wenestam Handledare: Ronnie Pingel

Transcript of En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos...

Page 1: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Statistiska institutionen

En simuleringsstudie paring sannolikhet foumlr typ I-fel och styrka hos olika

normalitetstest paring avrundade data

Houmlstterminen 2018

Jakob Gunnarsson amp Arvid Wenestam Handledare Ronnie Pingel

Abstract

When data is collected sample size and precision in measurements are often limited In what

sense this impacts the size unadjusted and adjusted power of different normality tests is a

relatively unexplored field Therefore this paper is dedicated to perform a simulation study

where these three properties of the normality tests Anderson-Darling Jarque-Bera and

Shapiro-Wilk are examined The study is based on different combinations of sample sizes and

roundings where repeated samples are drawn from both normally and asymmetrically

distributed populations The results from the study indicate that coarser roundings results in

increased size and unadjusted power of Anderson-Darling and Shapiro-Wilk while

Jarque-Bera is seemingly unaffected by roundnings The three tests have in common that a

larger sample size leads to an increase in the size unadjusted and adjusted power of the tests

and that roundings have no substantial impact on adjusted power

Sammanfattning

Naumlr data samlas in aumlr ofta stickprovsstorlek och precision i maumltningarna begraumlnsad i olika

grad Vilken betydelse detta faringr foumlr sannolikheten foumlr typ I-fel ojusterad samt justerad styrka

hos olika normalitetstest aumlr ett foumlrharingllandevis outforskat omraringde Daumlrfoumlr dedikeras denna

uppsats till att genomfoumlra en simuleringsstudie daumlr dessa tre egenskaper hos normalitetstesten

Anderson-Darling Jarque-Bera samt Shapiro-Wilk undersoumlks Studien baseras paring olika

kombinationer av stickprovsstorlekar samt avrundningar daumlr upprepade stickprov dras fraringn

baringde normalfoumlrdelade och asymmetriskt foumlrdelade populationer Resultaten fraringn studien

indikerar att groumlvre avrundningar leder till oumlkad sannolikhet foumlr typ I-fel och ojusterad styrka

hos Anderson-Darling och Shapiro-Wilk medan Jarque-Bera inte paringverkas naumlmnvaumlrt av

avrundningar Gemensamt foumlr samtliga test aumlr att en stoumlrre stickprovsstorlek leder till oumlkad

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka samt att avrundningar inte

naumlmnvaumlrt paringverkar justerad styrka Nyckelord

Normalitetstest Anderson-Darling Jarque-Bera Shapiro-Wilk Monte Carlo

skev normalfoumlrdelning styrka justerad styrka avrundningskvot stickprovsstorlek

1

Inneharingllsfoumlrteckning 1 Inledning 2

2 Teori 4 21 Hypotesproumlvningar 5 22 Tre typer av normalitetstest 5 23 Avrundningar 8

3 Metod 8 31 De stora talens lag 9 32 Val av stickprovsstorlekar 9 33 Val av avrundningskvoter 10 34 Foumlrdelningar 10 35 Skev normalfoumlrdelning 10 36 Signifikansnivaring 11 37 Justerad styrka 11

4 Resultat 11 41 Sannolikhet foumlr typ I-fel 12 42 Ojusterad styrka 13 43 Justerad styrka 15

5 Diskussion 17

6 Slutsats 19

Kaumlllfoumlrteckning 21 Appendix A - Illustration av asymmetriska foumlrdelningar 22 Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka) 23 Appendix C - Sannolikhet foumlr typ I-fel 24 Appendix D - Ojusterad styrka 25 Appendix E - Justerad styrka 29 Appendix F - Illustration av CDF foumlr olika avrundningskvoter 33 Appendix G - Kurtosis hos avrundade data 35

2

1 Inledning

ldquo it is not enough to that a sample could have come from a normal population we must be

clear that it is at the same time improbable that it has come from a population differing so

much from the normal as to invalidate the use of ldquonormal theoryrdquo tests in further handling of

the materialrdquo (Pearson 1930)

Antagandet om normalitet aumlr en grundpelare i maringnga statistiska metoder Utfoumlr vi exempelvis

ett t-test antar vi att stickprovet kommer fraringn en normalfoumlrdelad population Medan vissa

metoder aumlr robusta mot maringttliga avvikelser fraringn normalitet aumlr andra inte det De negativa

effekter som kan medfoumlras av att antagandet inte haringller kan vara saring allvarliga att det leder till

felaktiga slutsatser (Patriacutecio Ferreira Oliveiros amp Caramelo 2017) Aumlr exempelvis en

medicin verkningsloumls men paringvisar effekt i en laumlkemedelsstudie paring grund av att foumlrdelningen

hos populationen inte aumlr normalfoumlrdelad kan det faring starkt negativa konsekvenser foumlr de

patienter som byter till den verkningsloumlsa medicinen Likasaring aumlr det allvarligt om en medicin

har en effekt men att denna inte upptaumlcks i laumlkemedelsstudien

Det aumlr i fallet daring stickprovsstorleken aumlr liten som antagandet om normalitet i synnerhet boumlr

proumlvas daring vi inte kan foumlrlita oss paring den centrala graumlnsvaumlrdessatsen Var graumlnsen foumlr

stickprovsstorleken garingr aumlr ibland oklart Samma gaumlller foumlr hur robusta olika metoder aumlr foumlr

avvikelser fraringn normalitet Vid osaumlkerhet boumlr man daumlrfoumlr utvaumlrdera huruvida datamaterialet aumlr

normalfoumlrdelat eller ej

Det finns maringnga metoder foumlr att undersoumlka om ett datamaterial aumlr normalfoumlrdelat Det finns

visuella metoder som analys av histogram och kvantil-kvantil diagram det finns ocksaring ett

flertal formella normalitetstest naringgot den haumlr uppsatsen fokuserar paring Formella

normalitetstest aumlr laumlmpliga att studera daring de har en houmlgre reliabilitet jaumlmfoumlrt med visuella

metoder som bygger paring subjektiva bedoumlmningar

Mer specifikt avser denna uppsats att primaumlrt studera avrundningar av data och dess betydelse

hos tre normalitetstest Empiriska data aumlr naumlstan alltid avrundade i naringgon utstraumlckning I

3

praktiken straumlcker sig dock behovet av exakthet inte utoumlver ett visst antal decimaler beroende

paring vad som maumlts Teoretiskt sett finns det dock alltid ytterligare noggrannhet att haumlmta daring det

mellan tvaring avrundade maumltvaumlrden matematiskt sett finns oaumlndligt maringnga tal med oaumlndligt antal

decimaler (Dahmstroumlm 2011) Faktiska vaumlrden kan avrundas avsiktligt exempelvis paring grund

av att variabler kategoriseras eller saring avrundas vaumlrden paring grund av begraumlnsning hos

maumltinstrument (Pearson DrsquoAgostino amp Bowman 1977)

I denna uppsats kommer vi presentera en simuleringsstudie som baseras paring tre olika

normalitetstest Anderson-Darling Jarque-Bera samt Shapiro-Wilk Syftet aumlr att jaumlmfoumlra

testen och vilken betydelse storlek paring avrundningar i kombination med olika

stickprovsstorlekar har paring sannolikheten foumlr typ I-fel ojusterad styrka samt justerad styrka

4

2 Teori

I foumlljande avsnitt presenteras relevant teori som anvaumlnds som verktyg foumlr utfoumlrandet av

studien samt analys av resultat

21 Hypotesproumlvningar

I den haumlr studien kommer hypotesproumlvningar utfoumlras paring tvaring typer av situationer ena

situationen aumlr naumlr nollhypotesen (att stickprovet kommer fraringn en normalfoumlrdelad population)

aumlr sann Den andra situationen aumlr naumlr nollhypotesen aumlr falsk Utifraringn huruvida nollhypotesen

aumlr sann eller inte kommer sannolikheten foumlr typ I-fel respektive styrka att maumltas

Hypotesproumlvningen aumlr formulerad paring foumlljande saumltt

tickprovet kommer f raringn en normalfoumlrdelad populationHo S

tickprovet kommer ej f raringn en normalfoumlrdelad populationHa S

Ett typ I-fel begarings om nollhypotesen foumlrkastas naumlr nollhypotesen aumlr sann I den haumlr uppsatsen

innebaumlr sannolikheten foumlr typ I-fel sannolikheten att nollhypotesen att stickprovet kommer

fraringn en normalfoumlrdelad population foumlrkastas naumlr nollhypotesen aumlr sann Signifikansnivaringn foumlr

hypotesproumlvningen ska teoretiskt sett sammanfalla med sannolikheten foumlr typ I-fel naumlr

stickprov fraringn en normalfoumlrdelad population dras ett stort antal garingnger Anvaumlnds en

signifikansnivaring paring 5 ska testet foumlrkasta den sanna nollhypotesen i genomsnitt 5 av fallen

(Koumlrner 2006)

Styrka innebaumlr i den haumlr uppsatsen styrkan av paringstaringendet under mothypotesen att stickprovet

inte kommer fraringn en normalfoumlrdelad population Styrkan av paringstaringendet under mothypotesen

aumlr ett minus sannolikheten foumlr ett typ II-fel det vill saumlga sannolikheten att nollhypotesen

foumlrkastas naumlr nollhypotesen aumlr falsk

5

22 Tre typer av normalitetstest

I foumlljande avsnitt presenteras de tre olika normalitetstest som kommer studeras Vi har valt

testen Anderson-Darling Jarque-Bera och Shapiro-Wilk Olika normalitetstest och framfoumlrallt

olika familjer av normalitetstest aumlr utformade paring olika saumltt och baseras paring olika faktorer Med

maringlet om att faring en bredare bild kring den eventuella paringverkan avrundningar och

stickprovsstorlek har paring olika normalitetstest vaumlljer vi tre test som redan aumlr vaumll studerade och

som vi anser vara representativa foumlr sina respektive familjer av normalitetstest Tidigare

studier visar att naumlr Anderson-Darling och Shapiro Wilk normalitetstest testats paring

asymmetriskt datamaterial har de presterat baumlst foumlr respektive familj (Yap amp Sim 2011)

Aumlven fast Jarque-Bera testet presterar baumlst paring symmetriska data (Noughabi amp Arghami 2011)

har vi valt att inkludera testet foumlr denna studie daring vi vill inkludera ett momentbaserat test

Anderson-Darling testet aumlr ett normalitetstest som tillhoumlr familjen av normalitetstest som

jaumlmfoumlr den empiriska och den hypotetiska kumulativa distributionsfunktionen (CDF) ett saring

kallat EDF-test Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr aumlr den empiriska CDFen och aumlr den hypotetiska CDFen (som foumlljerF n F

normalfoumlrdelningen)

Testet jaumlmfoumlr foumlrenklat distansen i y-led mellan den empiriska och den hypotetiska CDFen

oumlver alla vaumlrden paring x vilket leder till beslut om nollhypotesen ska foumlrkastas eller ej

Teststatistikan under nollhypotesen foumlljer inte en specifik foumlrdelning utan kritiska vaumlrden

baseras paring beraumlkningar fraringn simuleringar Teststatistikan foumlrkastas daring den oumlverskrider ettA2

visst kritiskt vaumlrde (Thode 2002)

6

Jarque-Bera testet aumlr ett normalitetstest som tillhoumlr familjen momentbaserade normalitetstest

daumlr teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr och aumlr skattningar av det tredje och fjaumlrde momentet aumlr stickprovets medelvaumlrdeμ︿3 μ︿4 x

och aumlr stickprovets variansσ︿2

Testet jaumlmfoumlr hur vaumll skevhet och kurtosis det vill saumlga tredje och fjaumlrde momentet hos det

empiriska datamaterialet oumlverensstaumlmmer med de foumlrvaumlntade vaumlrdena hos

normalfoumlrdelningen Teststatistikan approximeras foumllja en - foumlrdelning underx2(2)

nollhypotesen och nollhypotesen foumlrkastas om teststatistikan oumlverskrider ett visst kritiskt

vaumlrde (Thode 2002)

Shapiro-Wilk testet aumlr ett normalitetstest som tillhoumlr familjen regressionsbaserade test

Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr aumlr den ite orderstatistikan aumlr stickprovets medelvaumlrde och ges av foumlljandex(i) x ai

daumlr aumlr en vektor av foumlrvaumlntade vaumlrden av orderstastikor hos en (m m )m = 1 nT

normalfoumlrdelning och aumlr kovariansmatrisen av orderstastikornaV

7

Testet aumlr utformat paring ett saumltt som ska kunna identifiera avvikelser fraringn normalitet genom att

jaumlmfoumlra de empiriska orderstatistikorna med de foumlrvaumlntade orderstatistikorna hos en

normalfoumlrdelad population Teststatistikan under nollhypotesen foumlljer inte en specifik

foumlrdelning utan kritiska vaumlrden baseras paring simuleringar Nollhypotesen foumlrkastas om

teststatistikan underskrider ett visst vaumlrde (Thode 2002)

23 Avrundningar

Naumlr avrundningar ska studeras kan vi anvaumlnda kvoten mellan standardavvikelsen hos den

studerade variabeln och avrundningsintervallet i maumltningarna (Pearson mfl 1977)

l = (standardavvikelse)(avrundningsintervall)

Maumlter vi exempelvis IQ maumlts vaumlrdet i heltal och standardavvikelsen hos variabeln aumlr 15 detta

resulterar i en avrundningskvot paring 15 I sammanhanget att studera avrundningar aumlr en variabel

som maumlts med en decimals noggrannhet med standardavvikelsen 1 ekvivalent med en

likafoumlrdelad variabel som maumlts med tvaring decimalers noggrannhet med standardavvikelsen 01

daring avrundningskvoten aumlr densamma i baringda fallen Detta foumlrharingllningssaumltt till avrundningar

ligger till grund foumlr hur avrundningar kommer att studeras i den haumlr uppsatsen Vidare

kommer kvoten i fortsaumlttningen kallas ldquoavrundningskvotrdquo foumlr enkelhetens skull Foumlr att faring en

uppfattning om vilken betydelse olika storlekar paring avrundningskvoter faringr paring ett

normalfoumlrdelat datamaterial jaumlmfoumlr figurerna i Appendix F

8

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 2: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Abstract

When data is collected sample size and precision in measurements are often limited In what

sense this impacts the size unadjusted and adjusted power of different normality tests is a

relatively unexplored field Therefore this paper is dedicated to perform a simulation study

where these three properties of the normality tests Anderson-Darling Jarque-Bera and

Shapiro-Wilk are examined The study is based on different combinations of sample sizes and

roundings where repeated samples are drawn from both normally and asymmetrically

distributed populations The results from the study indicate that coarser roundings results in

increased size and unadjusted power of Anderson-Darling and Shapiro-Wilk while

Jarque-Bera is seemingly unaffected by roundnings The three tests have in common that a

larger sample size leads to an increase in the size unadjusted and adjusted power of the tests

and that roundings have no substantial impact on adjusted power

Sammanfattning

Naumlr data samlas in aumlr ofta stickprovsstorlek och precision i maumltningarna begraumlnsad i olika

grad Vilken betydelse detta faringr foumlr sannolikheten foumlr typ I-fel ojusterad samt justerad styrka

hos olika normalitetstest aumlr ett foumlrharingllandevis outforskat omraringde Daumlrfoumlr dedikeras denna

uppsats till att genomfoumlra en simuleringsstudie daumlr dessa tre egenskaper hos normalitetstesten

Anderson-Darling Jarque-Bera samt Shapiro-Wilk undersoumlks Studien baseras paring olika

kombinationer av stickprovsstorlekar samt avrundningar daumlr upprepade stickprov dras fraringn

baringde normalfoumlrdelade och asymmetriskt foumlrdelade populationer Resultaten fraringn studien

indikerar att groumlvre avrundningar leder till oumlkad sannolikhet foumlr typ I-fel och ojusterad styrka

hos Anderson-Darling och Shapiro-Wilk medan Jarque-Bera inte paringverkas naumlmnvaumlrt av

avrundningar Gemensamt foumlr samtliga test aumlr att en stoumlrre stickprovsstorlek leder till oumlkad

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka samt att avrundningar inte

naumlmnvaumlrt paringverkar justerad styrka Nyckelord

Normalitetstest Anderson-Darling Jarque-Bera Shapiro-Wilk Monte Carlo

skev normalfoumlrdelning styrka justerad styrka avrundningskvot stickprovsstorlek

1

Inneharingllsfoumlrteckning 1 Inledning 2

2 Teori 4 21 Hypotesproumlvningar 5 22 Tre typer av normalitetstest 5 23 Avrundningar 8

3 Metod 8 31 De stora talens lag 9 32 Val av stickprovsstorlekar 9 33 Val av avrundningskvoter 10 34 Foumlrdelningar 10 35 Skev normalfoumlrdelning 10 36 Signifikansnivaring 11 37 Justerad styrka 11

4 Resultat 11 41 Sannolikhet foumlr typ I-fel 12 42 Ojusterad styrka 13 43 Justerad styrka 15

5 Diskussion 17

6 Slutsats 19

Kaumlllfoumlrteckning 21 Appendix A - Illustration av asymmetriska foumlrdelningar 22 Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka) 23 Appendix C - Sannolikhet foumlr typ I-fel 24 Appendix D - Ojusterad styrka 25 Appendix E - Justerad styrka 29 Appendix F - Illustration av CDF foumlr olika avrundningskvoter 33 Appendix G - Kurtosis hos avrundade data 35

2

1 Inledning

ldquo it is not enough to that a sample could have come from a normal population we must be

clear that it is at the same time improbable that it has come from a population differing so

much from the normal as to invalidate the use of ldquonormal theoryrdquo tests in further handling of

the materialrdquo (Pearson 1930)

Antagandet om normalitet aumlr en grundpelare i maringnga statistiska metoder Utfoumlr vi exempelvis

ett t-test antar vi att stickprovet kommer fraringn en normalfoumlrdelad population Medan vissa

metoder aumlr robusta mot maringttliga avvikelser fraringn normalitet aumlr andra inte det De negativa

effekter som kan medfoumlras av att antagandet inte haringller kan vara saring allvarliga att det leder till

felaktiga slutsatser (Patriacutecio Ferreira Oliveiros amp Caramelo 2017) Aumlr exempelvis en

medicin verkningsloumls men paringvisar effekt i en laumlkemedelsstudie paring grund av att foumlrdelningen

hos populationen inte aumlr normalfoumlrdelad kan det faring starkt negativa konsekvenser foumlr de

patienter som byter till den verkningsloumlsa medicinen Likasaring aumlr det allvarligt om en medicin

har en effekt men att denna inte upptaumlcks i laumlkemedelsstudien

Det aumlr i fallet daring stickprovsstorleken aumlr liten som antagandet om normalitet i synnerhet boumlr

proumlvas daring vi inte kan foumlrlita oss paring den centrala graumlnsvaumlrdessatsen Var graumlnsen foumlr

stickprovsstorleken garingr aumlr ibland oklart Samma gaumlller foumlr hur robusta olika metoder aumlr foumlr

avvikelser fraringn normalitet Vid osaumlkerhet boumlr man daumlrfoumlr utvaumlrdera huruvida datamaterialet aumlr

normalfoumlrdelat eller ej

Det finns maringnga metoder foumlr att undersoumlka om ett datamaterial aumlr normalfoumlrdelat Det finns

visuella metoder som analys av histogram och kvantil-kvantil diagram det finns ocksaring ett

flertal formella normalitetstest naringgot den haumlr uppsatsen fokuserar paring Formella

normalitetstest aumlr laumlmpliga att studera daring de har en houmlgre reliabilitet jaumlmfoumlrt med visuella

metoder som bygger paring subjektiva bedoumlmningar

Mer specifikt avser denna uppsats att primaumlrt studera avrundningar av data och dess betydelse

hos tre normalitetstest Empiriska data aumlr naumlstan alltid avrundade i naringgon utstraumlckning I

3

praktiken straumlcker sig dock behovet av exakthet inte utoumlver ett visst antal decimaler beroende

paring vad som maumlts Teoretiskt sett finns det dock alltid ytterligare noggrannhet att haumlmta daring det

mellan tvaring avrundade maumltvaumlrden matematiskt sett finns oaumlndligt maringnga tal med oaumlndligt antal

decimaler (Dahmstroumlm 2011) Faktiska vaumlrden kan avrundas avsiktligt exempelvis paring grund

av att variabler kategoriseras eller saring avrundas vaumlrden paring grund av begraumlnsning hos

maumltinstrument (Pearson DrsquoAgostino amp Bowman 1977)

I denna uppsats kommer vi presentera en simuleringsstudie som baseras paring tre olika

normalitetstest Anderson-Darling Jarque-Bera samt Shapiro-Wilk Syftet aumlr att jaumlmfoumlra

testen och vilken betydelse storlek paring avrundningar i kombination med olika

stickprovsstorlekar har paring sannolikheten foumlr typ I-fel ojusterad styrka samt justerad styrka

4

2 Teori

I foumlljande avsnitt presenteras relevant teori som anvaumlnds som verktyg foumlr utfoumlrandet av

studien samt analys av resultat

21 Hypotesproumlvningar

I den haumlr studien kommer hypotesproumlvningar utfoumlras paring tvaring typer av situationer ena

situationen aumlr naumlr nollhypotesen (att stickprovet kommer fraringn en normalfoumlrdelad population)

aumlr sann Den andra situationen aumlr naumlr nollhypotesen aumlr falsk Utifraringn huruvida nollhypotesen

aumlr sann eller inte kommer sannolikheten foumlr typ I-fel respektive styrka att maumltas

Hypotesproumlvningen aumlr formulerad paring foumlljande saumltt

tickprovet kommer f raringn en normalfoumlrdelad populationHo S

tickprovet kommer ej f raringn en normalfoumlrdelad populationHa S

Ett typ I-fel begarings om nollhypotesen foumlrkastas naumlr nollhypotesen aumlr sann I den haumlr uppsatsen

innebaumlr sannolikheten foumlr typ I-fel sannolikheten att nollhypotesen att stickprovet kommer

fraringn en normalfoumlrdelad population foumlrkastas naumlr nollhypotesen aumlr sann Signifikansnivaringn foumlr

hypotesproumlvningen ska teoretiskt sett sammanfalla med sannolikheten foumlr typ I-fel naumlr

stickprov fraringn en normalfoumlrdelad population dras ett stort antal garingnger Anvaumlnds en

signifikansnivaring paring 5 ska testet foumlrkasta den sanna nollhypotesen i genomsnitt 5 av fallen

(Koumlrner 2006)

Styrka innebaumlr i den haumlr uppsatsen styrkan av paringstaringendet under mothypotesen att stickprovet

inte kommer fraringn en normalfoumlrdelad population Styrkan av paringstaringendet under mothypotesen

aumlr ett minus sannolikheten foumlr ett typ II-fel det vill saumlga sannolikheten att nollhypotesen

foumlrkastas naumlr nollhypotesen aumlr falsk

5

22 Tre typer av normalitetstest

I foumlljande avsnitt presenteras de tre olika normalitetstest som kommer studeras Vi har valt

testen Anderson-Darling Jarque-Bera och Shapiro-Wilk Olika normalitetstest och framfoumlrallt

olika familjer av normalitetstest aumlr utformade paring olika saumltt och baseras paring olika faktorer Med

maringlet om att faring en bredare bild kring den eventuella paringverkan avrundningar och

stickprovsstorlek har paring olika normalitetstest vaumlljer vi tre test som redan aumlr vaumll studerade och

som vi anser vara representativa foumlr sina respektive familjer av normalitetstest Tidigare

studier visar att naumlr Anderson-Darling och Shapiro Wilk normalitetstest testats paring

asymmetriskt datamaterial har de presterat baumlst foumlr respektive familj (Yap amp Sim 2011)

Aumlven fast Jarque-Bera testet presterar baumlst paring symmetriska data (Noughabi amp Arghami 2011)

har vi valt att inkludera testet foumlr denna studie daring vi vill inkludera ett momentbaserat test

Anderson-Darling testet aumlr ett normalitetstest som tillhoumlr familjen av normalitetstest som

jaumlmfoumlr den empiriska och den hypotetiska kumulativa distributionsfunktionen (CDF) ett saring

kallat EDF-test Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr aumlr den empiriska CDFen och aumlr den hypotetiska CDFen (som foumlljerF n F

normalfoumlrdelningen)

Testet jaumlmfoumlr foumlrenklat distansen i y-led mellan den empiriska och den hypotetiska CDFen

oumlver alla vaumlrden paring x vilket leder till beslut om nollhypotesen ska foumlrkastas eller ej

Teststatistikan under nollhypotesen foumlljer inte en specifik foumlrdelning utan kritiska vaumlrden

baseras paring beraumlkningar fraringn simuleringar Teststatistikan foumlrkastas daring den oumlverskrider ettA2

visst kritiskt vaumlrde (Thode 2002)

6

Jarque-Bera testet aumlr ett normalitetstest som tillhoumlr familjen momentbaserade normalitetstest

daumlr teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr och aumlr skattningar av det tredje och fjaumlrde momentet aumlr stickprovets medelvaumlrdeμ︿3 μ︿4 x

och aumlr stickprovets variansσ︿2

Testet jaumlmfoumlr hur vaumll skevhet och kurtosis det vill saumlga tredje och fjaumlrde momentet hos det

empiriska datamaterialet oumlverensstaumlmmer med de foumlrvaumlntade vaumlrdena hos

normalfoumlrdelningen Teststatistikan approximeras foumllja en - foumlrdelning underx2(2)

nollhypotesen och nollhypotesen foumlrkastas om teststatistikan oumlverskrider ett visst kritiskt

vaumlrde (Thode 2002)

Shapiro-Wilk testet aumlr ett normalitetstest som tillhoumlr familjen regressionsbaserade test

Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr aumlr den ite orderstatistikan aumlr stickprovets medelvaumlrde och ges av foumlljandex(i) x ai

daumlr aumlr en vektor av foumlrvaumlntade vaumlrden av orderstastikor hos en (m m )m = 1 nT

normalfoumlrdelning och aumlr kovariansmatrisen av orderstastikornaV

7

Testet aumlr utformat paring ett saumltt som ska kunna identifiera avvikelser fraringn normalitet genom att

jaumlmfoumlra de empiriska orderstatistikorna med de foumlrvaumlntade orderstatistikorna hos en

normalfoumlrdelad population Teststatistikan under nollhypotesen foumlljer inte en specifik

foumlrdelning utan kritiska vaumlrden baseras paring simuleringar Nollhypotesen foumlrkastas om

teststatistikan underskrider ett visst vaumlrde (Thode 2002)

23 Avrundningar

Naumlr avrundningar ska studeras kan vi anvaumlnda kvoten mellan standardavvikelsen hos den

studerade variabeln och avrundningsintervallet i maumltningarna (Pearson mfl 1977)

l = (standardavvikelse)(avrundningsintervall)

Maumlter vi exempelvis IQ maumlts vaumlrdet i heltal och standardavvikelsen hos variabeln aumlr 15 detta

resulterar i en avrundningskvot paring 15 I sammanhanget att studera avrundningar aumlr en variabel

som maumlts med en decimals noggrannhet med standardavvikelsen 1 ekvivalent med en

likafoumlrdelad variabel som maumlts med tvaring decimalers noggrannhet med standardavvikelsen 01

daring avrundningskvoten aumlr densamma i baringda fallen Detta foumlrharingllningssaumltt till avrundningar

ligger till grund foumlr hur avrundningar kommer att studeras i den haumlr uppsatsen Vidare

kommer kvoten i fortsaumlttningen kallas ldquoavrundningskvotrdquo foumlr enkelhetens skull Foumlr att faring en

uppfattning om vilken betydelse olika storlekar paring avrundningskvoter faringr paring ett

normalfoumlrdelat datamaterial jaumlmfoumlr figurerna i Appendix F

8

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 3: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Inneharingllsfoumlrteckning 1 Inledning 2

2 Teori 4 21 Hypotesproumlvningar 5 22 Tre typer av normalitetstest 5 23 Avrundningar 8

3 Metod 8 31 De stora talens lag 9 32 Val av stickprovsstorlekar 9 33 Val av avrundningskvoter 10 34 Foumlrdelningar 10 35 Skev normalfoumlrdelning 10 36 Signifikansnivaring 11 37 Justerad styrka 11

4 Resultat 11 41 Sannolikhet foumlr typ I-fel 12 42 Ojusterad styrka 13 43 Justerad styrka 15

5 Diskussion 17

6 Slutsats 19

Kaumlllfoumlrteckning 21 Appendix A - Illustration av asymmetriska foumlrdelningar 22 Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka) 23 Appendix C - Sannolikhet foumlr typ I-fel 24 Appendix D - Ojusterad styrka 25 Appendix E - Justerad styrka 29 Appendix F - Illustration av CDF foumlr olika avrundningskvoter 33 Appendix G - Kurtosis hos avrundade data 35

2

1 Inledning

ldquo it is not enough to that a sample could have come from a normal population we must be

clear that it is at the same time improbable that it has come from a population differing so

much from the normal as to invalidate the use of ldquonormal theoryrdquo tests in further handling of

the materialrdquo (Pearson 1930)

Antagandet om normalitet aumlr en grundpelare i maringnga statistiska metoder Utfoumlr vi exempelvis

ett t-test antar vi att stickprovet kommer fraringn en normalfoumlrdelad population Medan vissa

metoder aumlr robusta mot maringttliga avvikelser fraringn normalitet aumlr andra inte det De negativa

effekter som kan medfoumlras av att antagandet inte haringller kan vara saring allvarliga att det leder till

felaktiga slutsatser (Patriacutecio Ferreira Oliveiros amp Caramelo 2017) Aumlr exempelvis en

medicin verkningsloumls men paringvisar effekt i en laumlkemedelsstudie paring grund av att foumlrdelningen

hos populationen inte aumlr normalfoumlrdelad kan det faring starkt negativa konsekvenser foumlr de

patienter som byter till den verkningsloumlsa medicinen Likasaring aumlr det allvarligt om en medicin

har en effekt men att denna inte upptaumlcks i laumlkemedelsstudien

Det aumlr i fallet daring stickprovsstorleken aumlr liten som antagandet om normalitet i synnerhet boumlr

proumlvas daring vi inte kan foumlrlita oss paring den centrala graumlnsvaumlrdessatsen Var graumlnsen foumlr

stickprovsstorleken garingr aumlr ibland oklart Samma gaumlller foumlr hur robusta olika metoder aumlr foumlr

avvikelser fraringn normalitet Vid osaumlkerhet boumlr man daumlrfoumlr utvaumlrdera huruvida datamaterialet aumlr

normalfoumlrdelat eller ej

Det finns maringnga metoder foumlr att undersoumlka om ett datamaterial aumlr normalfoumlrdelat Det finns

visuella metoder som analys av histogram och kvantil-kvantil diagram det finns ocksaring ett

flertal formella normalitetstest naringgot den haumlr uppsatsen fokuserar paring Formella

normalitetstest aumlr laumlmpliga att studera daring de har en houmlgre reliabilitet jaumlmfoumlrt med visuella

metoder som bygger paring subjektiva bedoumlmningar

Mer specifikt avser denna uppsats att primaumlrt studera avrundningar av data och dess betydelse

hos tre normalitetstest Empiriska data aumlr naumlstan alltid avrundade i naringgon utstraumlckning I

3

praktiken straumlcker sig dock behovet av exakthet inte utoumlver ett visst antal decimaler beroende

paring vad som maumlts Teoretiskt sett finns det dock alltid ytterligare noggrannhet att haumlmta daring det

mellan tvaring avrundade maumltvaumlrden matematiskt sett finns oaumlndligt maringnga tal med oaumlndligt antal

decimaler (Dahmstroumlm 2011) Faktiska vaumlrden kan avrundas avsiktligt exempelvis paring grund

av att variabler kategoriseras eller saring avrundas vaumlrden paring grund av begraumlnsning hos

maumltinstrument (Pearson DrsquoAgostino amp Bowman 1977)

I denna uppsats kommer vi presentera en simuleringsstudie som baseras paring tre olika

normalitetstest Anderson-Darling Jarque-Bera samt Shapiro-Wilk Syftet aumlr att jaumlmfoumlra

testen och vilken betydelse storlek paring avrundningar i kombination med olika

stickprovsstorlekar har paring sannolikheten foumlr typ I-fel ojusterad styrka samt justerad styrka

4

2 Teori

I foumlljande avsnitt presenteras relevant teori som anvaumlnds som verktyg foumlr utfoumlrandet av

studien samt analys av resultat

21 Hypotesproumlvningar

I den haumlr studien kommer hypotesproumlvningar utfoumlras paring tvaring typer av situationer ena

situationen aumlr naumlr nollhypotesen (att stickprovet kommer fraringn en normalfoumlrdelad population)

aumlr sann Den andra situationen aumlr naumlr nollhypotesen aumlr falsk Utifraringn huruvida nollhypotesen

aumlr sann eller inte kommer sannolikheten foumlr typ I-fel respektive styrka att maumltas

Hypotesproumlvningen aumlr formulerad paring foumlljande saumltt

tickprovet kommer f raringn en normalfoumlrdelad populationHo S

tickprovet kommer ej f raringn en normalfoumlrdelad populationHa S

Ett typ I-fel begarings om nollhypotesen foumlrkastas naumlr nollhypotesen aumlr sann I den haumlr uppsatsen

innebaumlr sannolikheten foumlr typ I-fel sannolikheten att nollhypotesen att stickprovet kommer

fraringn en normalfoumlrdelad population foumlrkastas naumlr nollhypotesen aumlr sann Signifikansnivaringn foumlr

hypotesproumlvningen ska teoretiskt sett sammanfalla med sannolikheten foumlr typ I-fel naumlr

stickprov fraringn en normalfoumlrdelad population dras ett stort antal garingnger Anvaumlnds en

signifikansnivaring paring 5 ska testet foumlrkasta den sanna nollhypotesen i genomsnitt 5 av fallen

(Koumlrner 2006)

Styrka innebaumlr i den haumlr uppsatsen styrkan av paringstaringendet under mothypotesen att stickprovet

inte kommer fraringn en normalfoumlrdelad population Styrkan av paringstaringendet under mothypotesen

aumlr ett minus sannolikheten foumlr ett typ II-fel det vill saumlga sannolikheten att nollhypotesen

foumlrkastas naumlr nollhypotesen aumlr falsk

5

22 Tre typer av normalitetstest

I foumlljande avsnitt presenteras de tre olika normalitetstest som kommer studeras Vi har valt

testen Anderson-Darling Jarque-Bera och Shapiro-Wilk Olika normalitetstest och framfoumlrallt

olika familjer av normalitetstest aumlr utformade paring olika saumltt och baseras paring olika faktorer Med

maringlet om att faring en bredare bild kring den eventuella paringverkan avrundningar och

stickprovsstorlek har paring olika normalitetstest vaumlljer vi tre test som redan aumlr vaumll studerade och

som vi anser vara representativa foumlr sina respektive familjer av normalitetstest Tidigare

studier visar att naumlr Anderson-Darling och Shapiro Wilk normalitetstest testats paring

asymmetriskt datamaterial har de presterat baumlst foumlr respektive familj (Yap amp Sim 2011)

Aumlven fast Jarque-Bera testet presterar baumlst paring symmetriska data (Noughabi amp Arghami 2011)

har vi valt att inkludera testet foumlr denna studie daring vi vill inkludera ett momentbaserat test

Anderson-Darling testet aumlr ett normalitetstest som tillhoumlr familjen av normalitetstest som

jaumlmfoumlr den empiriska och den hypotetiska kumulativa distributionsfunktionen (CDF) ett saring

kallat EDF-test Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr aumlr den empiriska CDFen och aumlr den hypotetiska CDFen (som foumlljerF n F

normalfoumlrdelningen)

Testet jaumlmfoumlr foumlrenklat distansen i y-led mellan den empiriska och den hypotetiska CDFen

oumlver alla vaumlrden paring x vilket leder till beslut om nollhypotesen ska foumlrkastas eller ej

Teststatistikan under nollhypotesen foumlljer inte en specifik foumlrdelning utan kritiska vaumlrden

baseras paring beraumlkningar fraringn simuleringar Teststatistikan foumlrkastas daring den oumlverskrider ettA2

visst kritiskt vaumlrde (Thode 2002)

6

Jarque-Bera testet aumlr ett normalitetstest som tillhoumlr familjen momentbaserade normalitetstest

daumlr teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr och aumlr skattningar av det tredje och fjaumlrde momentet aumlr stickprovets medelvaumlrdeμ︿3 μ︿4 x

och aumlr stickprovets variansσ︿2

Testet jaumlmfoumlr hur vaumll skevhet och kurtosis det vill saumlga tredje och fjaumlrde momentet hos det

empiriska datamaterialet oumlverensstaumlmmer med de foumlrvaumlntade vaumlrdena hos

normalfoumlrdelningen Teststatistikan approximeras foumllja en - foumlrdelning underx2(2)

nollhypotesen och nollhypotesen foumlrkastas om teststatistikan oumlverskrider ett visst kritiskt

vaumlrde (Thode 2002)

Shapiro-Wilk testet aumlr ett normalitetstest som tillhoumlr familjen regressionsbaserade test

Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr aumlr den ite orderstatistikan aumlr stickprovets medelvaumlrde och ges av foumlljandex(i) x ai

daumlr aumlr en vektor av foumlrvaumlntade vaumlrden av orderstastikor hos en (m m )m = 1 nT

normalfoumlrdelning och aumlr kovariansmatrisen av orderstastikornaV

7

Testet aumlr utformat paring ett saumltt som ska kunna identifiera avvikelser fraringn normalitet genom att

jaumlmfoumlra de empiriska orderstatistikorna med de foumlrvaumlntade orderstatistikorna hos en

normalfoumlrdelad population Teststatistikan under nollhypotesen foumlljer inte en specifik

foumlrdelning utan kritiska vaumlrden baseras paring simuleringar Nollhypotesen foumlrkastas om

teststatistikan underskrider ett visst vaumlrde (Thode 2002)

23 Avrundningar

Naumlr avrundningar ska studeras kan vi anvaumlnda kvoten mellan standardavvikelsen hos den

studerade variabeln och avrundningsintervallet i maumltningarna (Pearson mfl 1977)

l = (standardavvikelse)(avrundningsintervall)

Maumlter vi exempelvis IQ maumlts vaumlrdet i heltal och standardavvikelsen hos variabeln aumlr 15 detta

resulterar i en avrundningskvot paring 15 I sammanhanget att studera avrundningar aumlr en variabel

som maumlts med en decimals noggrannhet med standardavvikelsen 1 ekvivalent med en

likafoumlrdelad variabel som maumlts med tvaring decimalers noggrannhet med standardavvikelsen 01

daring avrundningskvoten aumlr densamma i baringda fallen Detta foumlrharingllningssaumltt till avrundningar

ligger till grund foumlr hur avrundningar kommer att studeras i den haumlr uppsatsen Vidare

kommer kvoten i fortsaumlttningen kallas ldquoavrundningskvotrdquo foumlr enkelhetens skull Foumlr att faring en

uppfattning om vilken betydelse olika storlekar paring avrundningskvoter faringr paring ett

normalfoumlrdelat datamaterial jaumlmfoumlr figurerna i Appendix F

8

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 4: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

1 Inledning

ldquo it is not enough to that a sample could have come from a normal population we must be

clear that it is at the same time improbable that it has come from a population differing so

much from the normal as to invalidate the use of ldquonormal theoryrdquo tests in further handling of

the materialrdquo (Pearson 1930)

Antagandet om normalitet aumlr en grundpelare i maringnga statistiska metoder Utfoumlr vi exempelvis

ett t-test antar vi att stickprovet kommer fraringn en normalfoumlrdelad population Medan vissa

metoder aumlr robusta mot maringttliga avvikelser fraringn normalitet aumlr andra inte det De negativa

effekter som kan medfoumlras av att antagandet inte haringller kan vara saring allvarliga att det leder till

felaktiga slutsatser (Patriacutecio Ferreira Oliveiros amp Caramelo 2017) Aumlr exempelvis en

medicin verkningsloumls men paringvisar effekt i en laumlkemedelsstudie paring grund av att foumlrdelningen

hos populationen inte aumlr normalfoumlrdelad kan det faring starkt negativa konsekvenser foumlr de

patienter som byter till den verkningsloumlsa medicinen Likasaring aumlr det allvarligt om en medicin

har en effekt men att denna inte upptaumlcks i laumlkemedelsstudien

Det aumlr i fallet daring stickprovsstorleken aumlr liten som antagandet om normalitet i synnerhet boumlr

proumlvas daring vi inte kan foumlrlita oss paring den centrala graumlnsvaumlrdessatsen Var graumlnsen foumlr

stickprovsstorleken garingr aumlr ibland oklart Samma gaumlller foumlr hur robusta olika metoder aumlr foumlr

avvikelser fraringn normalitet Vid osaumlkerhet boumlr man daumlrfoumlr utvaumlrdera huruvida datamaterialet aumlr

normalfoumlrdelat eller ej

Det finns maringnga metoder foumlr att undersoumlka om ett datamaterial aumlr normalfoumlrdelat Det finns

visuella metoder som analys av histogram och kvantil-kvantil diagram det finns ocksaring ett

flertal formella normalitetstest naringgot den haumlr uppsatsen fokuserar paring Formella

normalitetstest aumlr laumlmpliga att studera daring de har en houmlgre reliabilitet jaumlmfoumlrt med visuella

metoder som bygger paring subjektiva bedoumlmningar

Mer specifikt avser denna uppsats att primaumlrt studera avrundningar av data och dess betydelse

hos tre normalitetstest Empiriska data aumlr naumlstan alltid avrundade i naringgon utstraumlckning I

3

praktiken straumlcker sig dock behovet av exakthet inte utoumlver ett visst antal decimaler beroende

paring vad som maumlts Teoretiskt sett finns det dock alltid ytterligare noggrannhet att haumlmta daring det

mellan tvaring avrundade maumltvaumlrden matematiskt sett finns oaumlndligt maringnga tal med oaumlndligt antal

decimaler (Dahmstroumlm 2011) Faktiska vaumlrden kan avrundas avsiktligt exempelvis paring grund

av att variabler kategoriseras eller saring avrundas vaumlrden paring grund av begraumlnsning hos

maumltinstrument (Pearson DrsquoAgostino amp Bowman 1977)

I denna uppsats kommer vi presentera en simuleringsstudie som baseras paring tre olika

normalitetstest Anderson-Darling Jarque-Bera samt Shapiro-Wilk Syftet aumlr att jaumlmfoumlra

testen och vilken betydelse storlek paring avrundningar i kombination med olika

stickprovsstorlekar har paring sannolikheten foumlr typ I-fel ojusterad styrka samt justerad styrka

4

2 Teori

I foumlljande avsnitt presenteras relevant teori som anvaumlnds som verktyg foumlr utfoumlrandet av

studien samt analys av resultat

21 Hypotesproumlvningar

I den haumlr studien kommer hypotesproumlvningar utfoumlras paring tvaring typer av situationer ena

situationen aumlr naumlr nollhypotesen (att stickprovet kommer fraringn en normalfoumlrdelad population)

aumlr sann Den andra situationen aumlr naumlr nollhypotesen aumlr falsk Utifraringn huruvida nollhypotesen

aumlr sann eller inte kommer sannolikheten foumlr typ I-fel respektive styrka att maumltas

Hypotesproumlvningen aumlr formulerad paring foumlljande saumltt

tickprovet kommer f raringn en normalfoumlrdelad populationHo S

tickprovet kommer ej f raringn en normalfoumlrdelad populationHa S

Ett typ I-fel begarings om nollhypotesen foumlrkastas naumlr nollhypotesen aumlr sann I den haumlr uppsatsen

innebaumlr sannolikheten foumlr typ I-fel sannolikheten att nollhypotesen att stickprovet kommer

fraringn en normalfoumlrdelad population foumlrkastas naumlr nollhypotesen aumlr sann Signifikansnivaringn foumlr

hypotesproumlvningen ska teoretiskt sett sammanfalla med sannolikheten foumlr typ I-fel naumlr

stickprov fraringn en normalfoumlrdelad population dras ett stort antal garingnger Anvaumlnds en

signifikansnivaring paring 5 ska testet foumlrkasta den sanna nollhypotesen i genomsnitt 5 av fallen

(Koumlrner 2006)

Styrka innebaumlr i den haumlr uppsatsen styrkan av paringstaringendet under mothypotesen att stickprovet

inte kommer fraringn en normalfoumlrdelad population Styrkan av paringstaringendet under mothypotesen

aumlr ett minus sannolikheten foumlr ett typ II-fel det vill saumlga sannolikheten att nollhypotesen

foumlrkastas naumlr nollhypotesen aumlr falsk

5

22 Tre typer av normalitetstest

I foumlljande avsnitt presenteras de tre olika normalitetstest som kommer studeras Vi har valt

testen Anderson-Darling Jarque-Bera och Shapiro-Wilk Olika normalitetstest och framfoumlrallt

olika familjer av normalitetstest aumlr utformade paring olika saumltt och baseras paring olika faktorer Med

maringlet om att faring en bredare bild kring den eventuella paringverkan avrundningar och

stickprovsstorlek har paring olika normalitetstest vaumlljer vi tre test som redan aumlr vaumll studerade och

som vi anser vara representativa foumlr sina respektive familjer av normalitetstest Tidigare

studier visar att naumlr Anderson-Darling och Shapiro Wilk normalitetstest testats paring

asymmetriskt datamaterial har de presterat baumlst foumlr respektive familj (Yap amp Sim 2011)

Aumlven fast Jarque-Bera testet presterar baumlst paring symmetriska data (Noughabi amp Arghami 2011)

har vi valt att inkludera testet foumlr denna studie daring vi vill inkludera ett momentbaserat test

Anderson-Darling testet aumlr ett normalitetstest som tillhoumlr familjen av normalitetstest som

jaumlmfoumlr den empiriska och den hypotetiska kumulativa distributionsfunktionen (CDF) ett saring

kallat EDF-test Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr aumlr den empiriska CDFen och aumlr den hypotetiska CDFen (som foumlljerF n F

normalfoumlrdelningen)

Testet jaumlmfoumlr foumlrenklat distansen i y-led mellan den empiriska och den hypotetiska CDFen

oumlver alla vaumlrden paring x vilket leder till beslut om nollhypotesen ska foumlrkastas eller ej

Teststatistikan under nollhypotesen foumlljer inte en specifik foumlrdelning utan kritiska vaumlrden

baseras paring beraumlkningar fraringn simuleringar Teststatistikan foumlrkastas daring den oumlverskrider ettA2

visst kritiskt vaumlrde (Thode 2002)

6

Jarque-Bera testet aumlr ett normalitetstest som tillhoumlr familjen momentbaserade normalitetstest

daumlr teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr och aumlr skattningar av det tredje och fjaumlrde momentet aumlr stickprovets medelvaumlrdeμ︿3 μ︿4 x

och aumlr stickprovets variansσ︿2

Testet jaumlmfoumlr hur vaumll skevhet och kurtosis det vill saumlga tredje och fjaumlrde momentet hos det

empiriska datamaterialet oumlverensstaumlmmer med de foumlrvaumlntade vaumlrdena hos

normalfoumlrdelningen Teststatistikan approximeras foumllja en - foumlrdelning underx2(2)

nollhypotesen och nollhypotesen foumlrkastas om teststatistikan oumlverskrider ett visst kritiskt

vaumlrde (Thode 2002)

Shapiro-Wilk testet aumlr ett normalitetstest som tillhoumlr familjen regressionsbaserade test

Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr aumlr den ite orderstatistikan aumlr stickprovets medelvaumlrde och ges av foumlljandex(i) x ai

daumlr aumlr en vektor av foumlrvaumlntade vaumlrden av orderstastikor hos en (m m )m = 1 nT

normalfoumlrdelning och aumlr kovariansmatrisen av orderstastikornaV

7

Testet aumlr utformat paring ett saumltt som ska kunna identifiera avvikelser fraringn normalitet genom att

jaumlmfoumlra de empiriska orderstatistikorna med de foumlrvaumlntade orderstatistikorna hos en

normalfoumlrdelad population Teststatistikan under nollhypotesen foumlljer inte en specifik

foumlrdelning utan kritiska vaumlrden baseras paring simuleringar Nollhypotesen foumlrkastas om

teststatistikan underskrider ett visst vaumlrde (Thode 2002)

23 Avrundningar

Naumlr avrundningar ska studeras kan vi anvaumlnda kvoten mellan standardavvikelsen hos den

studerade variabeln och avrundningsintervallet i maumltningarna (Pearson mfl 1977)

l = (standardavvikelse)(avrundningsintervall)

Maumlter vi exempelvis IQ maumlts vaumlrdet i heltal och standardavvikelsen hos variabeln aumlr 15 detta

resulterar i en avrundningskvot paring 15 I sammanhanget att studera avrundningar aumlr en variabel

som maumlts med en decimals noggrannhet med standardavvikelsen 1 ekvivalent med en

likafoumlrdelad variabel som maumlts med tvaring decimalers noggrannhet med standardavvikelsen 01

daring avrundningskvoten aumlr densamma i baringda fallen Detta foumlrharingllningssaumltt till avrundningar

ligger till grund foumlr hur avrundningar kommer att studeras i den haumlr uppsatsen Vidare

kommer kvoten i fortsaumlttningen kallas ldquoavrundningskvotrdquo foumlr enkelhetens skull Foumlr att faring en

uppfattning om vilken betydelse olika storlekar paring avrundningskvoter faringr paring ett

normalfoumlrdelat datamaterial jaumlmfoumlr figurerna i Appendix F

8

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 5: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

praktiken straumlcker sig dock behovet av exakthet inte utoumlver ett visst antal decimaler beroende

paring vad som maumlts Teoretiskt sett finns det dock alltid ytterligare noggrannhet att haumlmta daring det

mellan tvaring avrundade maumltvaumlrden matematiskt sett finns oaumlndligt maringnga tal med oaumlndligt antal

decimaler (Dahmstroumlm 2011) Faktiska vaumlrden kan avrundas avsiktligt exempelvis paring grund

av att variabler kategoriseras eller saring avrundas vaumlrden paring grund av begraumlnsning hos

maumltinstrument (Pearson DrsquoAgostino amp Bowman 1977)

I denna uppsats kommer vi presentera en simuleringsstudie som baseras paring tre olika

normalitetstest Anderson-Darling Jarque-Bera samt Shapiro-Wilk Syftet aumlr att jaumlmfoumlra

testen och vilken betydelse storlek paring avrundningar i kombination med olika

stickprovsstorlekar har paring sannolikheten foumlr typ I-fel ojusterad styrka samt justerad styrka

4

2 Teori

I foumlljande avsnitt presenteras relevant teori som anvaumlnds som verktyg foumlr utfoumlrandet av

studien samt analys av resultat

21 Hypotesproumlvningar

I den haumlr studien kommer hypotesproumlvningar utfoumlras paring tvaring typer av situationer ena

situationen aumlr naumlr nollhypotesen (att stickprovet kommer fraringn en normalfoumlrdelad population)

aumlr sann Den andra situationen aumlr naumlr nollhypotesen aumlr falsk Utifraringn huruvida nollhypotesen

aumlr sann eller inte kommer sannolikheten foumlr typ I-fel respektive styrka att maumltas

Hypotesproumlvningen aumlr formulerad paring foumlljande saumltt

tickprovet kommer f raringn en normalfoumlrdelad populationHo S

tickprovet kommer ej f raringn en normalfoumlrdelad populationHa S

Ett typ I-fel begarings om nollhypotesen foumlrkastas naumlr nollhypotesen aumlr sann I den haumlr uppsatsen

innebaumlr sannolikheten foumlr typ I-fel sannolikheten att nollhypotesen att stickprovet kommer

fraringn en normalfoumlrdelad population foumlrkastas naumlr nollhypotesen aumlr sann Signifikansnivaringn foumlr

hypotesproumlvningen ska teoretiskt sett sammanfalla med sannolikheten foumlr typ I-fel naumlr

stickprov fraringn en normalfoumlrdelad population dras ett stort antal garingnger Anvaumlnds en

signifikansnivaring paring 5 ska testet foumlrkasta den sanna nollhypotesen i genomsnitt 5 av fallen

(Koumlrner 2006)

Styrka innebaumlr i den haumlr uppsatsen styrkan av paringstaringendet under mothypotesen att stickprovet

inte kommer fraringn en normalfoumlrdelad population Styrkan av paringstaringendet under mothypotesen

aumlr ett minus sannolikheten foumlr ett typ II-fel det vill saumlga sannolikheten att nollhypotesen

foumlrkastas naumlr nollhypotesen aumlr falsk

5

22 Tre typer av normalitetstest

I foumlljande avsnitt presenteras de tre olika normalitetstest som kommer studeras Vi har valt

testen Anderson-Darling Jarque-Bera och Shapiro-Wilk Olika normalitetstest och framfoumlrallt

olika familjer av normalitetstest aumlr utformade paring olika saumltt och baseras paring olika faktorer Med

maringlet om att faring en bredare bild kring den eventuella paringverkan avrundningar och

stickprovsstorlek har paring olika normalitetstest vaumlljer vi tre test som redan aumlr vaumll studerade och

som vi anser vara representativa foumlr sina respektive familjer av normalitetstest Tidigare

studier visar att naumlr Anderson-Darling och Shapiro Wilk normalitetstest testats paring

asymmetriskt datamaterial har de presterat baumlst foumlr respektive familj (Yap amp Sim 2011)

Aumlven fast Jarque-Bera testet presterar baumlst paring symmetriska data (Noughabi amp Arghami 2011)

har vi valt att inkludera testet foumlr denna studie daring vi vill inkludera ett momentbaserat test

Anderson-Darling testet aumlr ett normalitetstest som tillhoumlr familjen av normalitetstest som

jaumlmfoumlr den empiriska och den hypotetiska kumulativa distributionsfunktionen (CDF) ett saring

kallat EDF-test Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr aumlr den empiriska CDFen och aumlr den hypotetiska CDFen (som foumlljerF n F

normalfoumlrdelningen)

Testet jaumlmfoumlr foumlrenklat distansen i y-led mellan den empiriska och den hypotetiska CDFen

oumlver alla vaumlrden paring x vilket leder till beslut om nollhypotesen ska foumlrkastas eller ej

Teststatistikan under nollhypotesen foumlljer inte en specifik foumlrdelning utan kritiska vaumlrden

baseras paring beraumlkningar fraringn simuleringar Teststatistikan foumlrkastas daring den oumlverskrider ettA2

visst kritiskt vaumlrde (Thode 2002)

6

Jarque-Bera testet aumlr ett normalitetstest som tillhoumlr familjen momentbaserade normalitetstest

daumlr teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr och aumlr skattningar av det tredje och fjaumlrde momentet aumlr stickprovets medelvaumlrdeμ︿3 μ︿4 x

och aumlr stickprovets variansσ︿2

Testet jaumlmfoumlr hur vaumll skevhet och kurtosis det vill saumlga tredje och fjaumlrde momentet hos det

empiriska datamaterialet oumlverensstaumlmmer med de foumlrvaumlntade vaumlrdena hos

normalfoumlrdelningen Teststatistikan approximeras foumllja en - foumlrdelning underx2(2)

nollhypotesen och nollhypotesen foumlrkastas om teststatistikan oumlverskrider ett visst kritiskt

vaumlrde (Thode 2002)

Shapiro-Wilk testet aumlr ett normalitetstest som tillhoumlr familjen regressionsbaserade test

Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr aumlr den ite orderstatistikan aumlr stickprovets medelvaumlrde och ges av foumlljandex(i) x ai

daumlr aumlr en vektor av foumlrvaumlntade vaumlrden av orderstastikor hos en (m m )m = 1 nT

normalfoumlrdelning och aumlr kovariansmatrisen av orderstastikornaV

7

Testet aumlr utformat paring ett saumltt som ska kunna identifiera avvikelser fraringn normalitet genom att

jaumlmfoumlra de empiriska orderstatistikorna med de foumlrvaumlntade orderstatistikorna hos en

normalfoumlrdelad population Teststatistikan under nollhypotesen foumlljer inte en specifik

foumlrdelning utan kritiska vaumlrden baseras paring simuleringar Nollhypotesen foumlrkastas om

teststatistikan underskrider ett visst vaumlrde (Thode 2002)

23 Avrundningar

Naumlr avrundningar ska studeras kan vi anvaumlnda kvoten mellan standardavvikelsen hos den

studerade variabeln och avrundningsintervallet i maumltningarna (Pearson mfl 1977)

l = (standardavvikelse)(avrundningsintervall)

Maumlter vi exempelvis IQ maumlts vaumlrdet i heltal och standardavvikelsen hos variabeln aumlr 15 detta

resulterar i en avrundningskvot paring 15 I sammanhanget att studera avrundningar aumlr en variabel

som maumlts med en decimals noggrannhet med standardavvikelsen 1 ekvivalent med en

likafoumlrdelad variabel som maumlts med tvaring decimalers noggrannhet med standardavvikelsen 01

daring avrundningskvoten aumlr densamma i baringda fallen Detta foumlrharingllningssaumltt till avrundningar

ligger till grund foumlr hur avrundningar kommer att studeras i den haumlr uppsatsen Vidare

kommer kvoten i fortsaumlttningen kallas ldquoavrundningskvotrdquo foumlr enkelhetens skull Foumlr att faring en

uppfattning om vilken betydelse olika storlekar paring avrundningskvoter faringr paring ett

normalfoumlrdelat datamaterial jaumlmfoumlr figurerna i Appendix F

8

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 6: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

2 Teori

I foumlljande avsnitt presenteras relevant teori som anvaumlnds som verktyg foumlr utfoumlrandet av

studien samt analys av resultat

21 Hypotesproumlvningar

I den haumlr studien kommer hypotesproumlvningar utfoumlras paring tvaring typer av situationer ena

situationen aumlr naumlr nollhypotesen (att stickprovet kommer fraringn en normalfoumlrdelad population)

aumlr sann Den andra situationen aumlr naumlr nollhypotesen aumlr falsk Utifraringn huruvida nollhypotesen

aumlr sann eller inte kommer sannolikheten foumlr typ I-fel respektive styrka att maumltas

Hypotesproumlvningen aumlr formulerad paring foumlljande saumltt

tickprovet kommer f raringn en normalfoumlrdelad populationHo S

tickprovet kommer ej f raringn en normalfoumlrdelad populationHa S

Ett typ I-fel begarings om nollhypotesen foumlrkastas naumlr nollhypotesen aumlr sann I den haumlr uppsatsen

innebaumlr sannolikheten foumlr typ I-fel sannolikheten att nollhypotesen att stickprovet kommer

fraringn en normalfoumlrdelad population foumlrkastas naumlr nollhypotesen aumlr sann Signifikansnivaringn foumlr

hypotesproumlvningen ska teoretiskt sett sammanfalla med sannolikheten foumlr typ I-fel naumlr

stickprov fraringn en normalfoumlrdelad population dras ett stort antal garingnger Anvaumlnds en

signifikansnivaring paring 5 ska testet foumlrkasta den sanna nollhypotesen i genomsnitt 5 av fallen

(Koumlrner 2006)

Styrka innebaumlr i den haumlr uppsatsen styrkan av paringstaringendet under mothypotesen att stickprovet

inte kommer fraringn en normalfoumlrdelad population Styrkan av paringstaringendet under mothypotesen

aumlr ett minus sannolikheten foumlr ett typ II-fel det vill saumlga sannolikheten att nollhypotesen

foumlrkastas naumlr nollhypotesen aumlr falsk

5

22 Tre typer av normalitetstest

I foumlljande avsnitt presenteras de tre olika normalitetstest som kommer studeras Vi har valt

testen Anderson-Darling Jarque-Bera och Shapiro-Wilk Olika normalitetstest och framfoumlrallt

olika familjer av normalitetstest aumlr utformade paring olika saumltt och baseras paring olika faktorer Med

maringlet om att faring en bredare bild kring den eventuella paringverkan avrundningar och

stickprovsstorlek har paring olika normalitetstest vaumlljer vi tre test som redan aumlr vaumll studerade och

som vi anser vara representativa foumlr sina respektive familjer av normalitetstest Tidigare

studier visar att naumlr Anderson-Darling och Shapiro Wilk normalitetstest testats paring

asymmetriskt datamaterial har de presterat baumlst foumlr respektive familj (Yap amp Sim 2011)

Aumlven fast Jarque-Bera testet presterar baumlst paring symmetriska data (Noughabi amp Arghami 2011)

har vi valt att inkludera testet foumlr denna studie daring vi vill inkludera ett momentbaserat test

Anderson-Darling testet aumlr ett normalitetstest som tillhoumlr familjen av normalitetstest som

jaumlmfoumlr den empiriska och den hypotetiska kumulativa distributionsfunktionen (CDF) ett saring

kallat EDF-test Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr aumlr den empiriska CDFen och aumlr den hypotetiska CDFen (som foumlljerF n F

normalfoumlrdelningen)

Testet jaumlmfoumlr foumlrenklat distansen i y-led mellan den empiriska och den hypotetiska CDFen

oumlver alla vaumlrden paring x vilket leder till beslut om nollhypotesen ska foumlrkastas eller ej

Teststatistikan under nollhypotesen foumlljer inte en specifik foumlrdelning utan kritiska vaumlrden

baseras paring beraumlkningar fraringn simuleringar Teststatistikan foumlrkastas daring den oumlverskrider ettA2

visst kritiskt vaumlrde (Thode 2002)

6

Jarque-Bera testet aumlr ett normalitetstest som tillhoumlr familjen momentbaserade normalitetstest

daumlr teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr och aumlr skattningar av det tredje och fjaumlrde momentet aumlr stickprovets medelvaumlrdeμ︿3 μ︿4 x

och aumlr stickprovets variansσ︿2

Testet jaumlmfoumlr hur vaumll skevhet och kurtosis det vill saumlga tredje och fjaumlrde momentet hos det

empiriska datamaterialet oumlverensstaumlmmer med de foumlrvaumlntade vaumlrdena hos

normalfoumlrdelningen Teststatistikan approximeras foumllja en - foumlrdelning underx2(2)

nollhypotesen och nollhypotesen foumlrkastas om teststatistikan oumlverskrider ett visst kritiskt

vaumlrde (Thode 2002)

Shapiro-Wilk testet aumlr ett normalitetstest som tillhoumlr familjen regressionsbaserade test

Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr aumlr den ite orderstatistikan aumlr stickprovets medelvaumlrde och ges av foumlljandex(i) x ai

daumlr aumlr en vektor av foumlrvaumlntade vaumlrden av orderstastikor hos en (m m )m = 1 nT

normalfoumlrdelning och aumlr kovariansmatrisen av orderstastikornaV

7

Testet aumlr utformat paring ett saumltt som ska kunna identifiera avvikelser fraringn normalitet genom att

jaumlmfoumlra de empiriska orderstatistikorna med de foumlrvaumlntade orderstatistikorna hos en

normalfoumlrdelad population Teststatistikan under nollhypotesen foumlljer inte en specifik

foumlrdelning utan kritiska vaumlrden baseras paring simuleringar Nollhypotesen foumlrkastas om

teststatistikan underskrider ett visst vaumlrde (Thode 2002)

23 Avrundningar

Naumlr avrundningar ska studeras kan vi anvaumlnda kvoten mellan standardavvikelsen hos den

studerade variabeln och avrundningsintervallet i maumltningarna (Pearson mfl 1977)

l = (standardavvikelse)(avrundningsintervall)

Maumlter vi exempelvis IQ maumlts vaumlrdet i heltal och standardavvikelsen hos variabeln aumlr 15 detta

resulterar i en avrundningskvot paring 15 I sammanhanget att studera avrundningar aumlr en variabel

som maumlts med en decimals noggrannhet med standardavvikelsen 1 ekvivalent med en

likafoumlrdelad variabel som maumlts med tvaring decimalers noggrannhet med standardavvikelsen 01

daring avrundningskvoten aumlr densamma i baringda fallen Detta foumlrharingllningssaumltt till avrundningar

ligger till grund foumlr hur avrundningar kommer att studeras i den haumlr uppsatsen Vidare

kommer kvoten i fortsaumlttningen kallas ldquoavrundningskvotrdquo foumlr enkelhetens skull Foumlr att faring en

uppfattning om vilken betydelse olika storlekar paring avrundningskvoter faringr paring ett

normalfoumlrdelat datamaterial jaumlmfoumlr figurerna i Appendix F

8

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 7: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

22 Tre typer av normalitetstest

I foumlljande avsnitt presenteras de tre olika normalitetstest som kommer studeras Vi har valt

testen Anderson-Darling Jarque-Bera och Shapiro-Wilk Olika normalitetstest och framfoumlrallt

olika familjer av normalitetstest aumlr utformade paring olika saumltt och baseras paring olika faktorer Med

maringlet om att faring en bredare bild kring den eventuella paringverkan avrundningar och

stickprovsstorlek har paring olika normalitetstest vaumlljer vi tre test som redan aumlr vaumll studerade och

som vi anser vara representativa foumlr sina respektive familjer av normalitetstest Tidigare

studier visar att naumlr Anderson-Darling och Shapiro Wilk normalitetstest testats paring

asymmetriskt datamaterial har de presterat baumlst foumlr respektive familj (Yap amp Sim 2011)

Aumlven fast Jarque-Bera testet presterar baumlst paring symmetriska data (Noughabi amp Arghami 2011)

har vi valt att inkludera testet foumlr denna studie daring vi vill inkludera ett momentbaserat test

Anderson-Darling testet aumlr ett normalitetstest som tillhoumlr familjen av normalitetstest som

jaumlmfoumlr den empiriska och den hypotetiska kumulativa distributionsfunktionen (CDF) ett saring

kallat EDF-test Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr aumlr den empiriska CDFen och aumlr den hypotetiska CDFen (som foumlljerF n F

normalfoumlrdelningen)

Testet jaumlmfoumlr foumlrenklat distansen i y-led mellan den empiriska och den hypotetiska CDFen

oumlver alla vaumlrden paring x vilket leder till beslut om nollhypotesen ska foumlrkastas eller ej

Teststatistikan under nollhypotesen foumlljer inte en specifik foumlrdelning utan kritiska vaumlrden

baseras paring beraumlkningar fraringn simuleringar Teststatistikan foumlrkastas daring den oumlverskrider ettA2

visst kritiskt vaumlrde (Thode 2002)

6

Jarque-Bera testet aumlr ett normalitetstest som tillhoumlr familjen momentbaserade normalitetstest

daumlr teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr och aumlr skattningar av det tredje och fjaumlrde momentet aumlr stickprovets medelvaumlrdeμ︿3 μ︿4 x

och aumlr stickprovets variansσ︿2

Testet jaumlmfoumlr hur vaumll skevhet och kurtosis det vill saumlga tredje och fjaumlrde momentet hos det

empiriska datamaterialet oumlverensstaumlmmer med de foumlrvaumlntade vaumlrdena hos

normalfoumlrdelningen Teststatistikan approximeras foumllja en - foumlrdelning underx2(2)

nollhypotesen och nollhypotesen foumlrkastas om teststatistikan oumlverskrider ett visst kritiskt

vaumlrde (Thode 2002)

Shapiro-Wilk testet aumlr ett normalitetstest som tillhoumlr familjen regressionsbaserade test

Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr aumlr den ite orderstatistikan aumlr stickprovets medelvaumlrde och ges av foumlljandex(i) x ai

daumlr aumlr en vektor av foumlrvaumlntade vaumlrden av orderstastikor hos en (m m )m = 1 nT

normalfoumlrdelning och aumlr kovariansmatrisen av orderstastikornaV

7

Testet aumlr utformat paring ett saumltt som ska kunna identifiera avvikelser fraringn normalitet genom att

jaumlmfoumlra de empiriska orderstatistikorna med de foumlrvaumlntade orderstatistikorna hos en

normalfoumlrdelad population Teststatistikan under nollhypotesen foumlljer inte en specifik

foumlrdelning utan kritiska vaumlrden baseras paring simuleringar Nollhypotesen foumlrkastas om

teststatistikan underskrider ett visst vaumlrde (Thode 2002)

23 Avrundningar

Naumlr avrundningar ska studeras kan vi anvaumlnda kvoten mellan standardavvikelsen hos den

studerade variabeln och avrundningsintervallet i maumltningarna (Pearson mfl 1977)

l = (standardavvikelse)(avrundningsintervall)

Maumlter vi exempelvis IQ maumlts vaumlrdet i heltal och standardavvikelsen hos variabeln aumlr 15 detta

resulterar i en avrundningskvot paring 15 I sammanhanget att studera avrundningar aumlr en variabel

som maumlts med en decimals noggrannhet med standardavvikelsen 1 ekvivalent med en

likafoumlrdelad variabel som maumlts med tvaring decimalers noggrannhet med standardavvikelsen 01

daring avrundningskvoten aumlr densamma i baringda fallen Detta foumlrharingllningssaumltt till avrundningar

ligger till grund foumlr hur avrundningar kommer att studeras i den haumlr uppsatsen Vidare

kommer kvoten i fortsaumlttningen kallas ldquoavrundningskvotrdquo foumlr enkelhetens skull Foumlr att faring en

uppfattning om vilken betydelse olika storlekar paring avrundningskvoter faringr paring ett

normalfoumlrdelat datamaterial jaumlmfoumlr figurerna i Appendix F

8

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 8: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Jarque-Bera testet aumlr ett normalitetstest som tillhoumlr familjen momentbaserade normalitetstest

daumlr teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr

daumlr och aumlr skattningar av det tredje och fjaumlrde momentet aumlr stickprovets medelvaumlrdeμ︿3 μ︿4 x

och aumlr stickprovets variansσ︿2

Testet jaumlmfoumlr hur vaumll skevhet och kurtosis det vill saumlga tredje och fjaumlrde momentet hos det

empiriska datamaterialet oumlverensstaumlmmer med de foumlrvaumlntade vaumlrdena hos

normalfoumlrdelningen Teststatistikan approximeras foumllja en - foumlrdelning underx2(2)

nollhypotesen och nollhypotesen foumlrkastas om teststatistikan oumlverskrider ett visst kritiskt

vaumlrde (Thode 2002)

Shapiro-Wilk testet aumlr ett normalitetstest som tillhoumlr familjen regressionsbaserade test

Teststatistikan aumlr uppstaumllld enligt foumlljande

daumlr aumlr den ite orderstatistikan aumlr stickprovets medelvaumlrde och ges av foumlljandex(i) x ai

daumlr aumlr en vektor av foumlrvaumlntade vaumlrden av orderstastikor hos en (m m )m = 1 nT

normalfoumlrdelning och aumlr kovariansmatrisen av orderstastikornaV

7

Testet aumlr utformat paring ett saumltt som ska kunna identifiera avvikelser fraringn normalitet genom att

jaumlmfoumlra de empiriska orderstatistikorna med de foumlrvaumlntade orderstatistikorna hos en

normalfoumlrdelad population Teststatistikan under nollhypotesen foumlljer inte en specifik

foumlrdelning utan kritiska vaumlrden baseras paring simuleringar Nollhypotesen foumlrkastas om

teststatistikan underskrider ett visst vaumlrde (Thode 2002)

23 Avrundningar

Naumlr avrundningar ska studeras kan vi anvaumlnda kvoten mellan standardavvikelsen hos den

studerade variabeln och avrundningsintervallet i maumltningarna (Pearson mfl 1977)

l = (standardavvikelse)(avrundningsintervall)

Maumlter vi exempelvis IQ maumlts vaumlrdet i heltal och standardavvikelsen hos variabeln aumlr 15 detta

resulterar i en avrundningskvot paring 15 I sammanhanget att studera avrundningar aumlr en variabel

som maumlts med en decimals noggrannhet med standardavvikelsen 1 ekvivalent med en

likafoumlrdelad variabel som maumlts med tvaring decimalers noggrannhet med standardavvikelsen 01

daring avrundningskvoten aumlr densamma i baringda fallen Detta foumlrharingllningssaumltt till avrundningar

ligger till grund foumlr hur avrundningar kommer att studeras i den haumlr uppsatsen Vidare

kommer kvoten i fortsaumlttningen kallas ldquoavrundningskvotrdquo foumlr enkelhetens skull Foumlr att faring en

uppfattning om vilken betydelse olika storlekar paring avrundningskvoter faringr paring ett

normalfoumlrdelat datamaterial jaumlmfoumlr figurerna i Appendix F

8

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 9: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Testet aumlr utformat paring ett saumltt som ska kunna identifiera avvikelser fraringn normalitet genom att

jaumlmfoumlra de empiriska orderstatistikorna med de foumlrvaumlntade orderstatistikorna hos en

normalfoumlrdelad population Teststatistikan under nollhypotesen foumlljer inte en specifik

foumlrdelning utan kritiska vaumlrden baseras paring simuleringar Nollhypotesen foumlrkastas om

teststatistikan underskrider ett visst vaumlrde (Thode 2002)

23 Avrundningar

Naumlr avrundningar ska studeras kan vi anvaumlnda kvoten mellan standardavvikelsen hos den

studerade variabeln och avrundningsintervallet i maumltningarna (Pearson mfl 1977)

l = (standardavvikelse)(avrundningsintervall)

Maumlter vi exempelvis IQ maumlts vaumlrdet i heltal och standardavvikelsen hos variabeln aumlr 15 detta

resulterar i en avrundningskvot paring 15 I sammanhanget att studera avrundningar aumlr en variabel

som maumlts med en decimals noggrannhet med standardavvikelsen 1 ekvivalent med en

likafoumlrdelad variabel som maumlts med tvaring decimalers noggrannhet med standardavvikelsen 01

daring avrundningskvoten aumlr densamma i baringda fallen Detta foumlrharingllningssaumltt till avrundningar

ligger till grund foumlr hur avrundningar kommer att studeras i den haumlr uppsatsen Vidare

kommer kvoten i fortsaumlttningen kallas ldquoavrundningskvotrdquo foumlr enkelhetens skull Foumlr att faring en

uppfattning om vilken betydelse olika storlekar paring avrundningskvoter faringr paring ett

normalfoumlrdelat datamaterial jaumlmfoumlr figurerna i Appendix F

8

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 10: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

3 Metod

Monte Carlo metoden aumlr en laumlmplig metod foumlr att utfoumlra den haumlr typen av studie Metoden

innebaumlr att vi drar upprepade stickprov fraringn baringde normalfoumlrdelade och asymmetriskt

foumlrdelade populationer daumlr normalitetstest utfoumlrs paring varje stickprov och daumlr p-vaumlrdet av varje

test sparas Genom att saumltta en signifikansnivaring kommer en tabell erharingllas som visar andelen

av stickproven daumlr nollhypotesen foumlrkastas respektive inte foumlrkastas foumlr de olika

normalitetstesten Paring det saumlttet kan sannolikheten foumlr typ I-fel saringvaumll som styrka maumltas

beroende paring om populationen stickproven dras fraringn aumlr normalfoumlrdelad eller ej Simuleringarna

utfoumlrs i R (R 343) daumlr foumlljande paket har anvaumlnts rdquoDescToolsrdquo ldquotseriesrdquo ldquofGarchrdquo

ldquogoftestrdquo och ldquoMonteCarlordquo

Metoden kommer att anvaumlndas foumlr att maumlta sannolikhet foumlr typ I-fel hos testen foumlr fem olika

stickprovsstorlekar fyra olika avrundningskvoter samt kommer stickproven dras fraringn en

normalfoumlrdelad population (totalt 20 kombinationer av stickprov) Metoden kommer aumlven

anvaumlndas foumlr att maumlta styrkan hos de olika testen foumlr fyra olika stickprovsstorlekar fyra olika

avrundningskvoter samt kommer stickproven dras fraringn fyra olika asymmetriska foumlrdelningar

(totalt 64 kombinationer av stickprov)

31 De stora talens lag

De stora talens lag aumlr en sats inom sannolikhetsteorin som innebaumlr att medelvaumlrdet av ett stort

antal oberoende observationer sannolikt aumlr lokaliserat naumlra vaumlntevaumlrdet hos variabeln som

undersoumlks Naumlr Monte Carlo simuleringarna foumlr denna uppsats utfoumlrs kommer de olika

kombinationerna av stickprov upprepas 50 000 garingnger vardera foumlr att saumlkerstaumllla att den

sannolikhet foumlr typ I-fel ojusterad styrka och justerad styrka som erharinglls ligger foumlrharingllandevis

naumlra de sanna sannolikheterna

32 Val av stickprovsstorlekar

De olika stickprovsstorlekarna (n) som valts till studien av typ I-fel aumlr 10 30 50 100 samt

500 och de stickprovsstorlekar som valts foumlr studien av ojusterad samt justerad styrka aumlr 10

30 50 samt 100 Anledningen till att ytterligare en stickprovsstorlek (n=500) aumlr inkluderad i

9

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 11: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

studien av typ I-fel aumlr att vi vill tydligare aringskaringdliggoumlra den eventuella paringverkan avrundningar

har paring sannolikheten foumlr typ I-fel Vidare motiveras de valda stickprovsstorlekarna av att vi

vill studera relativt smaring stickprov daring proumlvning av normalitet framfoumlrallt aumlr viktigt paring mindre

stickprov Daumlremot vill vi titta paring ett bredare spann av stickprovsstorlekar foumlr att kunna

studera och jaumlmfoumlra hur de olika normalitetstesten presterar under olika foumlrharingllanden ett

spann mellan 10 och 100 bedoumlmdes daumlrfoumlr vara rimligt

33 Val av avrundningskvoter

De olika avrundningskvoter (l) som valts aumlr 5 7 10 och 15 I praktiken kommer vaumlrden

genereras fraringn olika foumlrdelningar med en decimals noggrannhet daumlr populationerna har

standardavvikelsen 05 07 1 och 15 vilket leder till kvoterna ovan I studien Pearson mfl

(1977) utfoumlrde kunde de konstatera att foumlr de normalitetstest de studerade hade

avrundningskvoter av storlekar mellan 3 och 10 en substantiell paringverkan paring sannolikheten foumlr

typ I-fel Foumlr avrundningskvoter oumlver 10 var paringverkan obetydlig Deras slutsatser ligger till

grund foumlr de avrundningskvoter som valts foumlr den haumlr studien

34 Foumlrdelningar

Naumlr vi drar stickprov fraringn normalfoumlrdelade populationer har vi valt att saumltta medelvaumlrdet till 0

standardavvikelsen till 05 07 1 respektive 15 och noggrannheten till en decimal

Naumlr vi drar stickprov fraringn skev normalfoumlrdelad population har vi valt att saumltta

skevhetsparametern till 15 2 25 respektive 3 Dessa vaumlrden motsvarar approximativt 056

079 088 och 092 i skevhet Foumlrdelningarna aumlr illustrerade i Appendix A i form av

densitetsgrafer Vi har valt att saumltta medelvaumlrdet till 0 standardavvikelsen till 05 07 1

respektive 15 och noggrannheten till en decimal

35 Skev normalfoumlrdelning

Skev normalfoumlrdelning aumlr en foumlrdelning som kan ses som en foumlrlaumlngning av

normalfoumlrdelningen och tillaringter skevhet skild fraringn noll Medelvaumlrde och standardavvikelse hos

en skev normalfoumlrdelning aumlr detsamma som foumlr en motsvarande normalfoumlrdelning samtidigt

som framfoumlrallt skevhet men ocksaring kurtosis skiljer sig aringt mellan foumlrdelningarna Daring vi i denna

10

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 12: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

studie vill kontrollera standardavvikelse och skevhet hos den population vi drar stickprov fraringn

aumlr skev normalfoumlrdelning en laumlmplig asymmetrisk foumlrdelning att anvaumlnda sig av Naumlr vi i

denna studie drar slumpmaumlssiga stickprov fraringn olika skeva normalfoumlrdelningar kommer vi att

saumltta medelvaumlrdet lika med noll men aumlndra standardavvikelse och skevheten Skevheten hos

foumlrdelningen paringverkas naumlr vaumlrdet hos skevhets-parametern ldquoxirdquo foumlraumlndras som den betecknas

i programmet R I programmet gaumlller att ett vaumlrde paring xi som aumlr 1 eller -1 motsvarar 0 i skevhet

hos populationen Ett vaumlrde oumlver 1 motsvarar positiv skevhet och ett vaumlrde som aumlr mindre aumln

-1 motsvarar negativ skevhet Asymmetrin hos de olika skeva normalfoumlrdelningar som

kommer anvaumlndas foumlr studien av styrka illustreras i Appendix A i form av densitetsdiagram

36 Signifikansnivaring

Foumlr att bestaumlmma naumlr testen ska foumlrkasta nollhypotesen har vi satt signifikansnivaringn 5 foumlr

samtliga test av typ I-fel samt ojusterad styrka

37 Justerad styrka

Naumlr styrkan hos olika test beraumlknas aumlr det problematiskt att jaumlmfoumlra hur vaumll testen presterar

om deras respektive sannolikhet foumlr typ I-fel inte aumlr densamma Daring faringr det test med houmlgst

sannolikhet foumlr typ I-fel ett foumlrspraringng naumlr beraumlkningarna paring styrka utfoumlrs vilket kan leda till

felaktiga slutsatser vid jaumlmfoumlrelse av testens prestation Foumlr att aringtgaumlrda detta kan justerad

styrka beraumlknas och anvaumlndas foumlr att goumlra mer raumlttvisa jaumlmfoumlrelser mellan testen som jaumlmfoumlrs

Foumlr att beraumlkna justerad styrka aumlr en enkel loumlsning att beraumlkna sanna kritiska vaumlrden foumlr testen

genom Monte Carlo simuleringar och anvaumlnda dem naumlr styrkan hos testen beraumlknas (Zhang amp

Boos 1994)

I den haumlr studien kommer p-vaumlrden genom Monte Carlo simuleringar beraumlknas foumlr att ta fram

beslutsregler foumlr varje test foumlr varje stickprovsstorlek och avrundningskvot beslutsregler som

naumlr de appliceras kommer generera att typ I-fel paring exakt 5 foumlr varje test och foumlr varje

stickprovsstorlek samt avrundningskvot (se Appendix B foumlr beslutsregler foumlr p-vaumlrden)

Dessa p-vaumlrden kommer anvaumlndas naumlr justerad styrka beraumlknas och resultatet kommer

anvaumlndas foumlr att mer raumlttvist utvaumlrdera hur de olika testen hanterar avvikelser fraringn normalitet

11

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 13: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

4 Resultat

I foumlljande avsnitt kommer resultaten fraringn studien av sannolikhet foumlr typ I-fel ojusterad samt

justerad styrka att presenteras Observera att de grafiska jaumlmfoumlrelserna mellan de olika testen

baseras paring tabellerna i Appendix C D samt E

41 Sannolikhet foumlr typ I-fel

Figur 41 visar sannolikheten foumlr typ I-fel hos testen Anderson-Darling Jarque-Bera samt

Shapiro-Wilk foumlr olika stickprovsstorlekar och avrundningskvoter daumlr grafernas kurvor aumlr

faumlrgkodade efter den avrundningskvot de representerar Som kan observeras oumlkar generellt

sett sannolikheten foumlr typ I-fel naumlr stickprovsstorleken oumlkar daumlr Shapiro-Wilk oumlkar mest (se

Appendix C foumlr att jaumlmfoumlra exakta vaumlrden) Vidare verkar det finnas en differens mellan

kurvorna hos baringde testet Anderson-Darling och Shapiro-Wilk en skillnad som dessutom

verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad observeras mellan kurvorna som

representerar l=5 och l=15 daring stickprovsstorleken aumlr 500 En mindre avrundningskvot verkar

innebaumlra en houmlgre sannolikhet foumlr typ I-fel foumlr testen Anderson-Darling och Shapiro-Wilk

Daumlremot verkar det moumlnster som observeras foumlr de naumlmnda testen inte gaumllla foumlr Jarque-Bera

daring ingen markant skillnad mellan de olika kurvorna kan observeras foumlr samtliga

stickprovsstorlekar Tittar vi paring Tabell 32 i Appendix C kan vi aumlven daumlr observera att

skillnaden mellan olika avrundningskvoter aumlr naumlst intill obefintlig och den skillnad som finns

verkar dessutom vara helt slumpmaumlssig Slutligen kan vi se att foumlr Jarque-Bera naumlrmar sig

sannolikheten foumlr typ I-fel det teoretiska vaumlrdet paring 5 naumlr stickprovsstorleken oumlkar samt foumlr

Anderson-Darling och Shapiro-Wilk aumlr de kurvor med houmlgst avrundningskvot belaumlgna

naumlrmast det teoretiska vaumlrdet

12

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 14: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Anderson-Darling Jarque-Bera

Shapiro-Wilk

Figur 41 - Sannolikhet foumlr typ I-fel vid signifikansnivaringn 5 hos Anderson-Darling (grafen upp till vaumlnster)

Jarque-Bera (grafen upp till houmlger) samt Shapiro-Wilk (grafen nere till vaumlnster) De olika

avrundningskvoterna aumlr faumlrgkodade enligt figuren

42 Ojusterad styrka

Nedan kommer resultaten fraringn studien av ojusterad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer ojusterad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix D aringterfinns tabeller med ojusterad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

13

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 15: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Anderson-Darling

Jarque-Bera

Shapiro-Wilk

Figur 42 - Ojusterad styrka hos Anderson-Darling (Houmlgst upp) Jarque-Bera (mitten) samt Shapiro-Wilk

(laumlngst ner) daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger) med

signifikansnivaringn 5 De olika avrundningskvoterna aumlr faumlrgkodade enligt figurerna

Figur 42 visar att den ojusterade styrkan hos Anderson-Darling oumlkar naumlr stickprovsstorleken

oumlkar foumlr samtliga avrundningskvoter Vidare kan en skillnad i styrka mellan de olika kurvorna

14

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 16: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

observeras en skillnad som dessutom verkar oumlka naumlr stickprovsstorleken oumlkar Stoumlrst skillnad

mellan kurvorna i baringda graferna observeras mellan kurvorna l=5 och l=15 daring

stickprovsstorleken aumlr 100 Figuren pekar paring att baringde en stoumlrre stickprovsstorlek samt en

mindre avrundningskvot leder till oumlkad styrka Mellan de tvaring graferna visas starka likheter

Daumlremot aumlr styrkan houmlgre foumlr samtliga stickprovsstorlekar och avrundningskvoter i den houmlgra

grafen

Figur 42 visar att den ojusterade styrkan hos Jarque-Bera i baringda fallen oumlkar naumlr

stickprovsstorleken oumlkar och att styrkan aumlr houmlgre foumlr samtliga stickprovsstorlekar i den houmlgra

grafen Vidare kan observeras att i baringda fallen verkar det inte finnas naringgon betydande skillnad

i styrka mellan de olika kurvorna foumlr respektive stickprovsstorlek (Se Appendix D Tabell 42

och 411 foumlr att jaumlmfoumlra vaumlrden)

Figur 42 visar att styrkan hos Shapiro-Wilk oumlkar naumlr stickprovsstorleken oumlkar Vidare kan

observeras att det finns en skillnad i styrka mellan de olika kurvorna och att skillnaden mellan

kurvorna i den vaumlnstra grafen oumlkar naumlr stickprovsstorleken oumlkar I houmlgra grafen oumlkar

skillnaden mellan kurvorna med oumlkad stickprovsstorlek foumlr att sedan minska naumlr styrkorna

naumlrmar sitt maximum 100 vilket aumlr ett vaumlntat resultat Som i fallet Anderson-Darling

verkar det som att stoumlrre stickprovsstorlek och mindre avrundningskvot leder till oumlkad styrka

foumlr Shapiro-Wilk

43 Justerad styrka

Nedan kommer resultaten fraringn studien av justerad styrka att presenteras foumlr de olika testen

Foumlr jaumlmfoumlrelse kommer justerad styrka att presenteras foumlr de olika testen daring stickproven

kommer fraringn skev normalfoumlrdelade populationer med parametervaumlrdet xi=15 respektive xi=3

I Appendix E aringterfinns tabeller med justerad styrka foumlr de olika testen foumlr samtliga

asymmetriska foumlrdelningar

Naumlr vi presenterar justerad styrka i form av grafer aumlr den justerade styrkan foumlr respektive test

och stickprovsstorlek beraumlknad genom medelvaumlrdet av den justerade styrkan foumlr varje

avrundningskvot foumlr respektive test och stickprovsstorlek Detta daring variationen hos den

15

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 17: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

justerade styrkan aumlr saring liten foumlr de olika avrundningskvoterna (se Appendix E) att en grafisk

jaumlmfoumlrelse av testen baserat paring avrundningskvoterna inte hade varit praktisk

Figur 43 visar hur vaumll de olika normalitetstesten hanterar asymmetriska data genom maringttet

justerad styrka I baringda graferna (och tabellerna i Appendix E) kan vi observera att testet

Shapiro-Wilk i samtliga fall har houmlgst justerad styrka av testen foumlljt av Jarque-Bera och

daumlrefter Anderson-Darling

Figur 43 - Justerad styrka hos testen Anderson-Darling Jarque-Bera och Shapiro-Wilk (enligt faumlrgkodning)

daring populationen aumlr skev normalfoumlrdelad med xi=15 (vaumlnster) respektive xi=3 (houmlger)

16

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 18: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

5 Diskussion

I 41 och 42 konstaterar vi att baringde sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Anderson-Darling oumlkar naumlr avrundningskvoten minskar samt naumlr stickprovsstorleken oumlkar

Testet baseras paring en jaumlmfoumlrelse av den empiriska CDFen (avrundad) och den hypotetiska

CDFen (ej avrundad) Som vi kan se i Appendix F observerar vi en stoumlrre diskrepans mellan

empirisk och hypotetisk CDF foumlr laumlgre avrundningskvoter Fraringn detta kan slutsatsen dras att

avrundningar paringverkar baringde ojusterad styrka samt sannolikhet foumlr typ I-fel hos testet daring det aumlr

kaumlnt att en stoumlrre diskrepans mellan empirisk och hypotetisk CDF leder till att testet enklare

foumlrkastar nollhypotesen att stickprovet kommer fraringn en normalfoumlrdelad population

Vi observerar aumlven ett en mer skevfoumlrdelad population leder till att nollhypotesen i regel

oftare foumlrkastas Det resultatet aumlr vaumlntat daring en mer skevfoumlrdelad population har en CDF som

avviker mer fraringn normalfoumlrdelningen jaumlmfoumlrt med en mindre skevfoumlrdelad population vilket

leder till att nollhypotesen enklare foumlrkastas

I 41 och 42 konstaterar vi att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Jarque-Bera inte paringverkas naumlmnvaumlrt av storleken hos de olika avrundningskvoterna Vi kan

daumlremot se att stickprovsstorleken och skevheten hos populationen har en liknande effekt paring

Jarque-Bera som paring Anderson-Darling Tittar vi paring formeln foumlr Jarque-Beras teststatistika ser

vi att den baseras paring stickprovsstorleken skevheten och kurtosis hos stickprovet Som kan

observeras i Tabell 71 i Appendix G paringverkar avrundningar inte kurtosis hos populationen

naumlmnvaumlrt Detta foumlrklarar varfoumlr avrundningar inte har naringgon paringtaglig effekt paring sannolikheten

foumlr typ I-fel samt ojusterad styrka Daumlremot finns en tydlig paringverkan av stickprovsstorlek samt

skevhet hos populationen Det kan foumlrklaras av att en skev normalfoumlrdelning inte har samma

kurtosis och skevhet som foumlrvaumlntas av en normalfoumlrdelning Vidare aumlr stickprovsstorleken en

faktor i teststatistikan vilket leder att effekten av foumlraumlndrad skevhet och kurtosis hos

stickprovet oumlkar naumlr stickprovsstorleken oumlkar vilket leder till att nollhypotesen enklare

foumlrkastas

17

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 19: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

I 41 och 42 klargoumlrs att sannolikheten foumlr typ I-fel samt ojusterad styrka hos testet

Shapiro-Wilk paringverkas av avrundningar stickprovsstorlek samt skevhet hos populationen

stickproven aumlr dragna fraringn Teststatistikan hos Shapiro-Wilk testet baseras foumlrenklat paring en

jaumlmfoumlrelse mellan orderstatistikor hos stickprovet och foumlrvaumlntade orderstatistikor hos en

normalfoumlrdelning Naumlr data avrundas paringverkar det vaumlrdet paring orderstatistikorna (se Appendix

F) daumlrfoumlr kan vi se att avrundningar har en effekt paring Shapiro-Wilk testet Det vi kan se aumlr att

en laumlgre avrundningskvot generellt leder till en oumlkad sannolikhet foumlr typ I-fel samt ojusterad

styrka daring en laumlgre avrundningskvot leder till stoumlrre skillnad mellan uppmaumltta och foumlrvaumlntade

orderstatistikor

Vidare kan vi se att om skevheten oumlkar hos den skev normalfoumlrdelade populationen

stickproven dras ifraringn saring oumlkar aumlven ojusterad styrka Detta daring en stoumlrre skevhet leder till att

orderstatistikorna avviker mer fraringn de foumlrvaumlntade orderstatistikorna

Naumlr justerad styrka beraumlknats baseras den paring beslutsregler foumlr p-vaumlrden som tagits fram foumlr att

sannolikheten foumlr typ I-fel ska bli exakt 5 foumlr alla test oumlver alla avrundningskvoter och

stickprovsstorlekar Detta foumlr att kunna jaumlmfoumlra hur vaumll testen identifierar ett stickprov som ej

normalfoumlrdelat paring ett mer raumlttvist saumltt Vi har observerat att storleken paring avrundningskvoten

inte paringverkar den justerade styrkan naumlmnvaumlrt foumlr samtliga test Anledningen till detta verkar

vara att den justerade styrkan aumlr justerad foumlr den effekt avrundningar har paring styrka men varfoumlr

vi fortfarande ser en liten variation i justerad styrka foumlr olika avrundningskvoter vet vi inte

Daumlremot kan vi anvaumlnda resultatet till att jaumlmfoumlra hur vaumll testen identifierar ett datamaterial

som ej normalfoumlrdelat Det vi observerar i Figur 43 aumlr att Shapiro-Wilk testet aumlr oumlverlaumlgset de

andra testen i sin foumlrmaringga att korrekt foumlrkasta nollhypotesen naumlr stickproven kommer fraringn

skev normalfoumlrdelade populationer Testet aumlr oumlverlaumlgset foumlr alla asymmetriskt foumlrdelade

populationer vi studerat Vi kan vidare se att Jarque-Bera hamnar strax efter Shapiro-Wilk och

paring sista plats hamnar Anderson-Darling som har en relativt laringg justerad styrka foumlr samtliga

stickprovsstorlekar och foumlrdelningar som testats

18

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 20: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

6 Slutsats

Vad det vi kommit fram till faringr foumlr implikationer naumlr man ska resonera kring vilket test som aumlr

laumlmpligast att anvaumlnda sig av i olika situationer aumlr svaringrt Det vi kan konstatera aumlr att

Shapiro-Wilk och Anderson-Darling relativt enkelt foumlrkastar nollhypotesen foumlr smaring stickprov

foumlr de foumlrdelningar vi studerat medan Jarque-Bera svaringrare foumlrkastar nollhypotesen Naumlr det

kommer till normalitetsproumlvningar kan det anses vara vaumlrre att inte foumlrkasta en falsk

nollhypotes jaumlmfoumlrt med att foumlrkasta en sann nollhypotes Med det i aringtanke om man har ett

litet stickprov som man vill bedoumlma om det kommer fraringn en normalfoumlrdelad population eller

ej kan det daumlrfoumlr vara baumlttremindre riskfyllt att anvaumlnda sig av testet Shapiro-Wilk eller

Anderson-Darling istaumlllet foumlr Jarque-Bera

Vidare har vi observerat att ett mer avrundat datamaterial leder till att testen Shapiro-Wilk och

Anderson-Darling laumlttare foumlrkastar nollhypotesen att stickproven kommer fraringn

normalfoumlrdelade populationer Det aumlr daumlrmed inte saumlrskilt skadligt med relativt kraftigt

avrundat datamaterial daring den allvarligaste risken foumlr testen risken foumlr typ II-fel minskar

Daumlremot ser vi att foumlr stoumlrre stickprov saring leder kraftigare avrundningar till att sannolikheten

foumlr typ I-fel oumlkar dramatiskt hos Shapiro-Wilk och Anderson-Darling Aumlr avrundningskvoten

liten och stickproven stora blir Shapiro-Wilk testet i princip obrukbart Vi har observerat att

foumlr l=5 och n=500 aumlr sannolikheten foumlr typ I-fel runt 65 foumlr Shapiro-Wilk I det fallet aumlr

Jarque-Bera mer anvaumlndbart daring det inte paringverkas av avrundningar och presterar mer

balanserat (balansen mellan sannolikhet foumlr typ I-fel och typ II-fel) naumlr stickprovsstorleken aumlr

stoumlrre

Resultatet av studien ligger ungefaumlr i linje med det vi foumlrvaumlntade oss paring foumlrhand Daumlremot aumlr

det oumlverraskande att avrundningar inte paringverkar kurtosis naumlmnvaumlrt naringgot som resulterat i att

Jarque-Bera inte paringverkas naumlmnvaumlrt Vidare aumlr det oumlverraskande att den justerade styrkan inte

paringverkas naumlmnvaumlrt av avrundningar vilket vi inte har ett klart svar paring

De slutsatser vi dragit om hur sannolikheten foumlr typ I-fel och ojusterad styrka hos de olika

testen paringverkas av avrundningar och stickprovsstorlekar bedoumlmer vi aumlr foumlrharingllandevis

19

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 21: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

allmaumlngiltiga saumlrskilt daring slutsatserna motiveras av testens uppbyggnad Det aumlr daumlremot viktigt

att poaumlngtera att de slutsatser som dragits kring hur vaumll testen presterar gentemot varandra

enbart gaumlller foumlr de skeva normalfoumlrdelningar vi dragit stickprov fraringn och de

stickprovsstorlekar samt avrundningskvoter vi studerat Drar vi andra typer av stickprov fraringn

exempelvis symmetriskt foumlrdelade populationer med mer fokus paring kurtosis skulle vi med

stoumlrsta sannolikhet faring ett annat resultat vilket aumlr naringgot som skulle vara intressant att studera

vidare

De potentiella felkaumlllor som finns ligger framfoumlrallt i tolkningen av resultatet daring vi inte

beraumlknat konfidensintervall foumlr varingra maumltningar Det aumlr daring framfoumlrallt jaumlmfoumlrelsen av

sannolikhet foumlr typ I-fel ojusterad styrka samt justerad styrka foumlr olika stickprovsstorlekar

som kan ha paringverkats Daumlremot aumlr det inget problem naumlr vi jaumlmfoumlr olika avrundningskvoter daring

vi har anvaumlnt samma seed i simuleringarna Detta innebaumlr att de stickprov som genererats aumlr

likafoumlrdelade foumlr de olika avrundningskvoterna foumlr varje stickprovsstorlek en jaumlmfoumlrelse kan

daumlrmed goumlras direkt utan hjaumllp av konfidensintervall

20

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 22: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Kaumlllfoumlrteckning

Dahmstroumlm K (2011) Fraringn datainsamling till rapport att goumlra en statistisk undersoumlkning

Studentlitteratur

Koumlrner S amp Wahlgren L (2006) Statistisk dataanalys Lund Studentlitteratur

Noughabi H A amp Arghami N R (2011) Monte Carlo comparison of seven normality

tests Journal of Statistical Computation and Simulation 81(8) 965ndash972

Patriacutecio M Ferreira F Oliveiros B amp Caramelo F (2017) Comparing the performance

of normality tests with ROC analysis and confidence intervals Communications in

Statistics - Simulation and Computation 46(10) 7535ndash7551

Pearson E S (1930) A Further Development Of Tests For Normality Biometrika 22(1ndash2)

239ndash249

Pearson E S DrsquoAgostino R B amp Bowman K O (1977) Tests for Departure from

Normality Comparison of Powers Biometrika 64(2) 231

Thode H C (2002) Testing For Normality CRC Press

Yap B W amp Sim C H (2011) Comparisons of various types of normality tests Journal of

Statistical Computation and Simulation 81(12) 2141ndash2155

Zhang J amp Boos D D (1994) Adjusted power estimates in monte carlo experiments

Communications in Statistics - Simulation and Computation 23(1) 165ndash173

Adrian Trapletti and Kurt Hornik (2018) tseries Time Series Analysis and Computational

Finance R package version 010-46 Andri Signorell et mult al (2018) DescTools Tools for descriptive statistics R package

version 09926

Christian Hendrik Leschinski (2018) MonteCarlo Automatic Parallelized Monte Carlo

Simulations R package version 105

Diethelm Wuertz Tobias Setz Yohan Chalabi Chris Boudt Pierre Chausse and Michal

Miklovac (2017) fGarch Rmetrics - Autoregressive Conditional Heteroskedastic

Modelling R package version 304283

Julian Faraway George Marsaglia John Marsaglia and Adrian Baddeley (2017) goftest

Classical Goodness-of-Fit Tests for Univariate Distributions R package version 11-1

21

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 23: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Appendix

Appendix A - Illustration av asymmetriska foumlrdelningar

Figur 11 - Densitetsdiagram oumlver normalfoumlrdelning Figur 12 - Densitetsdiagram oumlver normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=15 (block) (roumld) och skev normalfoumlrdelning med xi=2 (block)

Figur 13 - Densitetsdiagram oumlver normalfoumlrdelning Figur 14 - Densitetsdiagram oumlver

normalfoumlrdelning

(roumld) och skev normalfoumlrdelning med xi=25 (block) (roumld) och skev normalfoumlrdelning med xi=3 (block)

22

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 24: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Appendix B - Beslutsregler foumlr p-vaumlrden (justerad styrka)

Tabell 21 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Anderson-Darling testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

AD n=10 n=30 n=50 n=100

l=5 004936283 004744479 004513705 004186913

l=7 005043106 004880005 004751135 004549577

l=10 005022371 00499787 004878998 00484638

l=15 005057758 004998208 004884848 004920565 Tabell 22 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Jarque-Bera testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

JB n=10 n=30 n=50 n=100

l=5 02900271 01106576 008317414 006621627

l=7 02909806 01097647 008219307 006741895

l=10 02913935 01088463 008065181 006748149

l=15 02913278 01092166 008444739 00675565 Tabell 23 - Beslutsregler foumlr p-vaumlrden som ger en sannolikhet foumlr typ I-fel paring exakt 5 naumlr de implementeras i studien av sannolikheten av typ I-fel hos Shapiro-Wilk testet Respektive beslutsregel gaumlller foumlr respektive stickprovsstorlek och avrundningskvot och kommer anvaumlndas naumlr justerad styrka beraumlknas

SW n=10 n=30 n=50 n=100

l=5 00425287 003782205 003652465 00264485

l=7 004662601 00426817 004310016 003632495

l=10 004859565 004551326 004684312 004323066

l=15 004954068 004689571 004973613 004726834

23

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 25: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Appendix C - Sannolikhet foumlr typ I-fel Tabell 31 - Sannolikhet foumlr typ I-fel hos Anderson-Darling testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

AD n=10 n=30 n=50 n=100 n=500

l=5 506 528 557 613 1389

l=7 495 512 529 554 835

l=10 497 500 512 523 648

l=15 492 500 509 512 571 Tabell 32 - Sannolikhet foumlr typ I-fel hos Jarque-Bera testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

JB n=10 n=30 n=50 n=100 n=500

l=5 083 308 363 419 479

l=7 079 308 368 415 477

l=10 079 305 368 415 471

l=15 080 307 365 418 476 Tabell 33 - Sannolikhet foumlr typ I-fel hos Shapiro-Wilk testet daring det utfoumlrs paring stickprov med olika stickprovsstorlekar (n) samt olika avrundningskvoter ( l )

SW n=10 n=30 n=50 n=100 n=500

l=5 580 659 727 919 6367

l=7 535 584 615 674 2042

l=10 513 550 568 574 1038

l=15 498 532 538 527 691

24

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 26: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Appendix D - Ojusterad styrka Tabell 41 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 597 742 941 1523

l=7 586 722 896 1382

l=10 585 708 872 1338

l=15 580 705 858 1301

Tabell 42 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 170 1021 1782 4108

l=7 169 104 1794 4141

l=10 171 1035 1796 4143

l=15 169 1032 1800 4150

Tabell 43 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 911 2257 3756 6975

l=7 859 2135 3477 6512

l=10 835 2069 3359 6256

l=15 819 2022 3279 6122

25

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 27: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Tabell 44 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 662 1002 1449 2974

l=7 651 974 1378 2738

l=10 647 967 1347 2638

l=15 643 954 1334 2586

Tabell 45 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 253 1801 3355 7577

l=7 249 1808 3377 7606

l=10 252 1813 3382 7622

l=15 249 1814 3383 7628

Tabell 46 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1355 4338 6968 9678

l=7 1296 4164 6703 9547

l=10 1252 4041 6567 9473

l=15 1241 4002 6489 9435

26

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 28: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Tabell 47 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 701 1170 1787 3847

l=7 701 1146 1707 3606

l=10 693 1125 1668 3486

l=15 692 1115 1650 3426

Tabell 48 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 303 2199 4203 8734

l=7 308 2213 4216 8760

l=10 312 2221 4225 8780

l=15 311 2225 4235 8790

Tabell 49 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1619 5553 8367 9957

l=7 1568 5359 8147 9933

l=10 1526 5251 8050 9918

l=15 1500 5186 7976 9906

27

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 29: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Tabell 410 - Styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 730 1262 1966 4384

l=7 714 1229 1882 4120

l=10 712 1213 1845 3990

l=15 707 1200 1826 3919

Tabell 411 - Styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 338 2412 4619 9145

l=7 339 2428 4636 9170

l=10 374 2432 4641 9179

l=15 341 2436 4660 9186

Tabell 412 - Styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) daumlr stickproven dragits fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1773 6179 8923 9993

l=7 1681 5983 8752 9984

l=10 1647 5880 8662 9979

l=15 1635 5835 8608 9975

28

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 30: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Appendix E - Justerad styrka Tabell 51 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 588 703 856 1297

l=7 591 707 856 1279

l=10 587 708 852 1298

l=15 588 705 841 1283

Tabell 52 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 762 1512 2249 4606

l=7 778 1510 2238 4673

l=10 776 1511 2235 4676

l=15 774 1510 2279 4685

Tabell 53 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 15 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 11 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 792 1897 3222 5934

l=7 816 1926 3245 5985

l=10 814 1952 3256 6015

l=15 812 1946 3270 6033

29

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 31: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Tabell 54 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 653 957 1324 2579

l=7 656 956 1322 2558

l=10 650 967 1319 2580

l=15 649 954 1309 2558

Tabell 55 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1028 2550 4128 8093

l=7 1039 2553 4122 8151

l=10 1052 2557 4095 8168

l=15 1046 2557 4198 8187

Tabell 56 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 2 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 12 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1197 3810 6423 9390

l=7 1232 3867 6449 9389

l=10 1226 3877 6452 9399

l=15 1233 3880 6481 9405

30

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 32: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Tabell 57 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 698 1121 1637 3419

l=7 706 1120 1631 3393

l=10 695 1125 1635 3420

l=15 699 1114 1621 3392

Tabell 58 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1207 3089 5101 9126

l=7 1212 3084 5102 9168

l=10 1212 3074 5070 9178

l=15 1223 3091 5174 9183

Tabell 59 - Justerad styrka hos Shapiro-Wilk testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 25 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 13 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1450 4995 7938 9892

l=7 1492 5051 7943 9896

l=10 1492 5065 7956 9900

l=15 1491 5062 7969 9897

31

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 33: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Tabell 510 - Justerad styrka hos Anderson-Darling testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 21 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

AD n=10 n=30 n=50 n=100

l=5 722 1205 1813 3914

l=7 721 1204 1806 3874

l=10 716 1213 1813 3907

l=15 716 1200 1796 3879

Tabell 511 - Justerad styrka hos Jarque-Bera testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 22 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

JB n=10 n=30 n=50 n=100

l=5 1294 3365 5573 9440

l=7 1298 3372 5595 9478

l=10 1298 3358 5553 9497

l=15 1308 3370 5666 9499

Tabell 512 - Justerad styrka hos Shapiro- testet foumlr respektive stickprovsstorlek (n) och avrundningskvot ( l ) naumlr respektive beslutsregel presenterad i Tabell 23 applicerats Stickproven aumlr dragna fraringn en skev normalfoumlrdelning med vaumlrde 3 hos skevhetsparametern Hur foumlrdelningen ser ut och hur den skiljer sig fraringn normalfoumlrdelningen illustreras i Figur 14 i Appendix A

SW n=10 n=30 n=50 n=100

l=5 1569 5634 8566 9972

l=7 1611 5668 8582 9973

l=10 1618 5708 8584 9972

l=15 1624 5707 8602 9972

32

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 34: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Appendix F - Illustration av CDF foumlr olika avrundningskvoter

Figur 61 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 05 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 5 (blaring)

Figur 62 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 07 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 7 (blaring)

33

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 35: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Figur 63 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 1 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 10 (blaring)

Figur 64 - Illustrering av den kumulativa distributionsfunktionen hos en normalfoumlrdelning med medelvaumlrde

0 och standardavvikelse 15 (svart) samt den kumulativa foumlrdelningen hos samma foumlrdelning fast med

avrundningskvoten 15 (blaring)

34

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35

Page 36: En simuleringsstudie på sannolikhet för typ I-fel och ...1285134/FULLTEXT01.pdf · hos Anderson-Darling och Shapiro-Wilk, medan Jarque-Bera inte påverkas nämnvärt av avrundningar.

Appendix G - Kurtosis hos avrundade data

Tabell 71 - Kurtosis hos normalfoumlrdelade populationer som aumlr avrundade enligt vaumlnstra kolumnen Kurtosis

hos varje population baseras paring 10 miljoner slumpmaumlssigt dragna observationer

Avrundingskvot Kurtosis

l=5 30014

l=7 30010

l=10 30000

l=15 30011

35