Statistiek 1

Get Started. It's Free
or sign up with your email address
Rocket clouds
Statistiek 1 by Mind Map: Statistiek 1

1. Basiskennis

1.1. Beschrijvende statistiek

1.2. Inferentiële statistiek

1.2.1. Populatie

1.2.1.1. Parameters: mu, sigma, pi, alfa, beta

1.2.2. Steekproef

1.2.2.1. Steekproefgrootheid = statistic

1.2.2.2. Steekproeffout (= toevalsfout, random error)

1.2.2.2.1. = verschil steekproef en ware populatie

1.2.2.3. Soorten

1.2.2.3.1. Enkelvoudige aselecte steekproef

1.2.2.3.2. Systematische aselecte steekproef

1.2.2.3.3. Cluster steekproef

1.2.2.3.4. Getrapte (multistage) steekproef

1.2.2.3.5. Gestratificeerde steekproef

1.2.2.4. Steekpreofvariabliteit

1.2.2.4.1. Sampling bias

1.2.2.4.2. Response bias

1.2.2.4.3. Non response bias

1.2.2.4.4. Experimenter's bias

1.2.3. Variabelen

1.2.3.1. Categorisch

1.2.3.2. Kwantitatief

1.2.3.2.1. Discreet

1.2.3.2.2. Continu

1.2.4. Meetniveaus

1.2.4.1. Nominaal

1.2.4.1.1. taartdiagram, staafdiagram, frequentieverdeling (relatieve, absolutie, geldende en cumulatieve fequentie).

1.2.4.2. Ordinaal

1.2.4.2.1. Histogram... (zie IHS)

1.2.4.3. Interval

1.2.4.4. Ratio

2. Cohens D: effectgrootte

2.1. . ÿ1 - ÿ2 d = ------------ s

2.2. > 1.3 → zeer groot effect

2.3. Tussen 0.8 en 1.29 → groot effect

2.4. Tussen 0.5 en 0.79 → middelgroot effect

2.5. Tussen 0.2 en 0.49 → klein effect

2.6. Tussen -0.19 en 0.19 → verwaarloosbaar klein

3. Verdelingen

3.1. Normaalverdeling

3.1.1. Maten

3.1.1.1. Vorm

3.1.1.2. Centrum

3.1.1.2.1. Gemiddelde

3.1.1.2.2. Mediaan

3.1.1.2.3. Modus

3.1.1.3. Spreiding

3.1.1.3.1. Standaardeviatie

3.1.1.3.2. Range

3.1.2. Empirische regel

3.1.2.1. ± 68% tussen y - s en y + s ± 95% tussen y - 2s en y + 2s Bijna alle observaties tussen y - 3s en y + 3s

3.1.2.2. bb

3.1.3. Percentiel

3.1.4. Box plot

3.2. Kansverdeling

3.2.1. Kansregels

3.2.2. Populatieverdeling

3.2.2.1. N, µ, σ

3.2.3. Steekproefverdeling

3.2.3.1. n, ÿ, s

3.2.4. Steekproevenverdeling

3.2.4.1. n, µ, se

3.2.4.1.1. Standaardfout s se = -------- √ n

3.2.5. Standaardnormaalverdeling = z-verdeling

3.2.5.1. . yi - µ z = --------- σ

4. Inferentiele statistiek

4.1. Theorie

4.1.1. parameter = eigenschap populatie

4.1.2. schatter = eigenschap steekproef

4.1.3. schatting = vanuit steekproef geschatte eigenschap van populatie

4.1.4. puntschattingen = schatting in de vorm van een getal

4.1.5. intervalschattingen = getalleninterval, waarvan je gelooft dat de parameter daarin ligt

4.2. Betrouwbaarheidsinterval BI

4.2.1. = 1 - α (α = onbetrouwbaarheid)

4.2.2. Berekenen grenswaarden (géén significantietoets!)

4.2.2.1. Voor proportie Π

4.2.2.1.1. z-toets → z-tabel

4.2.2.1.2. ^ Π ± z * se

4.2.2.1.3. . ^ ^ Π * (1 - Π) se = √ -------------- n

4.2.2.1.4. . ^ Gegeven: BI, kans, n en Π Zoek kans op in z-tabel → geeft z-waarde. Vul formule in. Geef interval ...% BI [ - ]

4.2.2.2. Voor gemiddelde ÿ

4.2.2.2.1. t-toets → t-tabel

4.2.2.2.2. df = n - 1

4.2.2.2.3. ÿ ± t * se

4.2.2.2.4. . s se = -------- √ n

4.2.2.2.5. Gegeven: BI, kans, n, ÿ en s Bereken t (met df = n - 1 en t-tabel) Vul formule in. Geef interval ...% BI [ - ]

5. Significantie toetsen

5.1. Verschil 1-zijdig en 2-zijdig

5.1.1. ≤ of ≥ in H0 en HA → enkelzijdig

5.1.2. = en ≠ → dubbelzijdig → p * 2

5.2. Significantieniveau

5.2.1. niveau α → H0 wel of niet verwerpen

5.2.2. Type 1 fout

5.2.2.1. H0 onterecht verwerpen

5.2.2.2. Kans heirop is α

5.2.3. Type 2 fout

5.2.3.1. H0 onterecht niet verwerpen

5.2.3.2. Kans hierop is β

5.2.4. Betrouwbaarheid = 1 - α

5.2.4.1. α tekent de H0 in

5.2.5. Power = 1 - β

5.2.5.1. β tekent de Ha in

5.2.6. Verklein je α, dan vergroot je je kans op β

5.2.7. Vergroot je α, dan verklein je de kans op β

5.3. 2 groepen met elkaar vergelijken

5.3.1. Toets

5.3.1.1. Voor proporties Π

5.3.1.1.1. z-toets

5.3.1.1.2. . ^ ^ Π2 - Π1 z = ------------ se

5.3.1.1.3. . ^ ^ ^ ^ Π1 * (1 - Π) Π2 * (1 - Π2) se = √ ----------------- + ------------------ n1 n2

5.3.1.2. Voor gemiddelden ÿ

5.3.1.2.1. t-toets

5.3.1.2.2. df = n1 + n2 - 2

5.3.1.2.3. . ÿ2 - ÿ1 t = ------------ se

5.3.1.2.4. . s1^2 s2^2 se = √ ----------------- + ------------------ n1 n2

5.3.2. Betrouwbaarheidsinterval

5.3.2.1. Voor proporties Π

5.3.2.1.1. z-toets

5.3.2.1.2. . ^ ^ ( Π2 - Π1 ) ± z * se

5.3.2.1.3. . ^ ^ ^ ^ Π1 * (1 - Π) Π2 * (1 - Π2) se = √ ----------------- + ------------------ n1 n2

5.3.2.1.4. . ^ ^ Gegeven: n1, Π1, n2 en Π2 z = 1,96 Vul formule in. Geef interval ...% BI [ - ] Als 0 niet in interval ligt, verschil wél sign! Als 0 wél in interval ligt, verschil niet sign!

5.3.2.2. Voor gemiddelden ÿ

5.3.2.2.1. t-toets

5.3.2.2.2. df = n1 + n2 - 2

5.3.2.2.3. ( ÿ2 - ÿ1 ) ± t * se

5.3.2.2.4. . s1^2 s2^2 se = √ ----------------- + ------------------ n1 n2

5.3.2.2.5. Gegeven: n1, ÿ1, n2 en ÿ2. Zoek t in t-tabel bij #df. Vul formule in. Geef interval ...% BI [ - ]. Als 0 niet in interval ligt, verschil wél sign! Als 0 wél in interval ligt, verschil niet sign!

5.4. 1 groep (vergelijken met α)

5.4.1. Voor proportie Π

5.4.1.1. z-toets

5.4.1.2. . ^ Π - Π z = -------- se

5.4.1.3. . Π * (1 - Π) se = √ -------------- n

5.4.1.4. Zoek uitkomst formule op in z-tabel: Hoeveel decimalen? Dit wordt je p-waarde (2-zijdig → p * 2) p ≤ α → H0 verwerpen: sign! p ≥ α → H0 niet verwerpen: niet sign!

5.4.2. Voor gemiddelde ÿ

5.4.2.1. t-toets

5.4.2.2. df = n - 1

5.4.2.3. . ÿ - µ t = ------- se

5.4.2.4. . s se = -------- √ n

5.4.2.5. Zoek uitkomst formule op in t-tabel bij #df Welk significantieniveau? (alles rechts van 95% (t.025) sgin!) Dit wordt je p-waarde (2-zijdig → p * 2) Als niet in tabel, mag je zeggen: p < .001 p ≤ α → H0 verwerpen: sign! p ≥ α → H0 niet verwerpen: niet sign!

5.5. Stappenplan

5.5.1. 1. Wat hadden we verwacht? 2. Wat hebben we gevonden? 3. Hoe ver ligt dit uit elkaar? 4. Hoe groot is de kans dat dit gebeurt? Let op: 1-zijdig of 2-zijdig toetsen?

5.5.2. 1. Assumpties (kwantitatieve variabele, randomisatie, normale verdeling, robuust)

5.5.3. 2. Hypothesen H0: µ /Π = x HA: µ /Π ≠ x

5.5.4. 3. Toetsingsgrootheid t-toets of z-toets?

5.5.5. 4. P-waarde = de kans dat de toetsingsgrootheid gelijk is aan geobserveerde waarde, of meer extreem in de richting zoals voorspeld door HA). Aanname is H0. LET OP DUBBELZIJDIG/ENKELZIJDIG TOETSEN: 2-zijdig = p * 2

6. Lineaire regressie en correlatie

6.1. Verklaarde variantie r^2

6.1.1. Hoeveel van de variantie in y kunnen we verklaren adhv x?

6.1.2. . TSS - SSE RSS r^2 = --------------- = ------ TSS TSS

6.1.3. TSS = Σ (y1 - ÿ) ^2

6.1.3.1. Total Sum of Squares =

6.1.4. SSE = Σ (y1 - ŷ) ^2

6.1.4.1. Residu = Sum of Squared Errors =

6.1.5. RSS = TSS - SSE

6.1.5.1. Regression Sum of Squares =

6.2. Regressie

6.2.1. Toetsen of relatie sign is

6.2.1.1. . b - 0 t = --------- se

6.2.1.1.1. . b t = --------- = se

6.2.1.2. H0: ß = 0 HA: ß ≠ 0

6.2.1.2.1. . s se = ------------------------- √ Σ ( x - ¨x)^2

6.2.1.2.2. . SSE s = √ ----------- n - 2

6.2.2. Betrouwbaarheidsinterval

6.2.2.1. b ± t(se), df = n - 2

6.2.3. ŷ = a + bx

6.2.3.1. ŷ = voorspelde y

6.2.3.2. a = intercept (hoogte)

6.2.3.3. b = richtingscoefficient = helling = slope = (∆y/∆x)

6.3. Correlatie

6.3.1. √ r^2 =

6.3.2. geeft sterkte correlatie weer

6.3.3. -1 tot 1

6.3.4. r > 0 → positieve relatie

6.3.5. r < 0 → negatieve relatie

6.3.6. r = 0 → geen relatie

6.3.7. Niet per se causaliteit!

6.3.8. Significantietoets

6.3.8.1. df = n - 2

6.3.8.2. . r t = -------------------------- √ ( 1 - r)^2 / (n - 2)

6.4. Interpretatie SPSS output

6.4.1. B

6.4.1.1. (Constant) = intercept = a

6.4.1.2. 'afh. var.' = richtingscoëfficiënt = b

6.4.2. Std. Error

6.4.2.1. (onderste) = se

7. Associatie van categorische variabelen

7.1. Kansen

7.1.1. . Deelgroep P = --------------- Totaal

7.2. Chi-kwadraattoets = x^2

7.2.1. . ( fo - fe )^2 x^2 = Σ ( ----------------- ) fe

7.2.2. . rijtotaal * kolomtotaal fe = -------------------------------- totaal

7.2.3. fo = geobserveerde frequentie (gegeven waarden tabel) fe = verwachte frequentie

7.2.4. df = (#rijen - 1) * (#kolommen - 1)

7.2.5. 1. Bereken fe per vakje 2. Formules invullen → geeft x^2 3. Bereken df 4. Zoek kritieke waarde in tabel door df te kruisen met sign.niveau 0.050. 5. x^2 > kritieke waarde → sign. x^2 < kritieke waarde → niet sign.

7.3. Gestandaardiseerde residu

7.3.1. Per vakje in tabel uitrekenen hoeveel de verwachte waarde fe afwijkt van de geobserveerde waarde fo, uitgedrukt in standaarddeviaties.

7.3.2. . fo - fe z = --------------------------------------------------------- √ fe (1 - rijproportie) * (1 - kolomproportie)

7.3.2.1. . fo - fe z = ---------- se

7.3.2.2. se = √ fe (1 - rijproportie)(1 - kolomproportie)

7.3.2.2.1. Rijprop. = rijtotaal/totaal steekproef

7.3.2.2.2. Kolomprop. = kolomtotaal/totaal steekproef

7.3.3. Welk vakje het sterkst van 0 afwijkt is het meest significante gestandaardiseerde residu

7.4. Odds(ratio)

7.4.1. . kans op succes odds = ---------------------------- kans op geen succes

7.4.1.1. . P(succes) odds = ----------------- 1 - P (succes)

7.4.2. Odds ratio = Hoe sterk is de samenhang en hoe groot is de kans op iets. = de ratio van de conditionele oddsen tot elkaar.

7.4.2.1. Kruistabel

7.4.2.1.1. . a * d odds ratio = -------- b * c

7.5. Concordantie

7.5.1. Als waarneming hoger is dan beide variabelen in tabel

7.5.1.1. Begin linksboven

7.6. Discordantie

7.6.1. Als waarneming hoger is dan ene variabele(n) en lager dan andere variabele(n) in tabel.

7.6.1.1. Begin rechtsboven

7.7. Gamma

7.7.1. niet geïnteresseerd of het sign. is, maar hoe sterk sign. iets is.

7.7.2. gestandaardiseerde samenhang =

7.7.3. . C - D ϒ = ---------- C + D

7.7.4. C > D = pos samenhang C < D = neg samenhang

7.7.5. Gamma valt tussen -1 en 1 - neg verband en + pos verband Hoe groter gamma, hoe sterker samenhang