Voortgezette Statistiek - Belangrijke Dingen

download Voortgezette Statistiek - Belangrijke Dingen

of 3

description

very usefull

Transcript of Voortgezette Statistiek - Belangrijke Dingen

Voortgezette StatistiekBelangrijke dingenSampling Distribution of x1-x21. Normal distributed if populations are normala. Approximately normal if populations are nonnormal and sample sizes are large2. E(x1-x2) = 1-23. V(x1-x2) = (1)2/n1 + (2)2/n2a. Standard error: wortel(V)Sampling Distribution of p1-p21. Approximately normally distributed if samples sizes are large enougha. 52. E(p^1-p^2) = p1-p23. V(p^1-p^2) = (p1*(1-p1))/n1 + = (p2*(1-p2))/n2a. Standard error ((p^1-p^2)): wortel VWilcoxon Rank Sum Test1. Comparing two populations2. Data are either ordinal or interval where the normality requirement necessary to perform the equal-variances t-test of 1-2 is unsatisfied3. The samples are independentTests on nominal data Z-test of p Z-test of p1-p2 Chi-squared goodness of fit test Chi-aquared test of a contingency tablePROBLEM OBJECTIVENUMBER OF CATEGORIESSTATISTICAL TECHNIQUE

Describe a population2z-test of pchi-squared goodness

Describe a populationMore than 2Chi goodness

Compare two populations2z-test of p1-p2chi contingency

Compare two populationsMore than 2Chi contingency

Compare two or more pop.2 or moreChi contingency

Analyze the relationship between two variables2 or moreChi contingency

Weetjes: Gebruik de parametrische toets, omdat die waarschijnlijk een hoger onderscheidingsvermogen zal hebben! Indien aan de veronderstellingen van een parametrische toets is voldaan, dan mag er zowel een parametrische als een niet-parametrische toets worden gebruikt. Bij een gegeven steekproefgrootte en een zekere waarde van , is de kans op een fout van de tweede soort groter bij een niet-parametrische toets dan bij een parametrische toets, mits je beide toetsen mag gebruiken. Indien er gebruik wordt gemaakt van een rangtekentoets (Wilcoxon signed rank sum test) dan mag er ook gebruik worden gemaakt van een tekentoets (sign test). De kans op een fout van de tweede soort neemt toe als de kans op een fout van de eerste soort afneemt. Het onderscheidingsvermogen van een toets neemt af wanneer het significantieniveau kleiner wordt. Een verandering van de steekproefgrootte (n) zal de kans op een fout van de eerste soort niet veranderen.P-valueSome interpretations: the p-value is the smallest significance level for which we reject the H0 the p-value measures the amount of statistical evidence if the p-value is small: then there is evidence beyond reasonable doubt the observed test statistic is unlikely to occur if H0 is true if the p-value, then reject H0.The p-value IS NOT: The probability that H0 is false. Explanation: H0 is a statement about a population parameter, which is assumed to be unknown but constant; so there is no randomness involved!Stappenplan1. Conditions (=assumptions+statistical info)2. Hypotheses3. Test statistic and its distribution4. Determine rejection / critical region5. Calculate the value of the test statistica. Or: calculate the p-valueConfront statistic with rejection regionb. Or: confront the p-value with the significance levelDecision in term of the hypotheses6. Formulate the conclusion ("Given the significance level, there is (not) sufficient evidence to infer that ")Sign Test Let A and B denote two random variables. Location distribution of A location distribution B?Main idea: p=P=> (observation from A > observation from B) If location A = location B, then p = 0.5 H0: Location of the 2 distributions is the same p=0.5 H1: Distribution A is located to the right of B p>0.5 H1: Distribution A is located to the left of B p xobs)2. Reject H0 if p-value , so the p-value is the smallest significance level for where the H0 is rejected.Lillieforswe vergelijken de verdelingsfunctie van de best-fitting normale verdeling met de empirische (=waargenomen) verdelingsfunctie