Vollbild-Modus

Testtheorie

Andere

Rabiya D

Folgen

Jetzt loslegen. Gratis!

oder registrieren mit Ihrer E-Mail-Adresse

Ähnliche Mindmaps Mindmap-Gliederung

Testtheorie von Rabiya D Mind Map: Testtheorie

1. Grundlagen

1.1. Testarten

1.1.1. Leistungstest

1.1.2. Persönlichkeitsfragebögen

1.1.3. Objektive Persönlichkeitstests

1.1.4. Projektive Verfahren

1.1.5. Apparitive Tests

1.2. Gütekriterien

1.2.1. Objektivität

1.2.1.1. Durchführungsobjektivität

1.2.1.2. Auswertungsobjektivität

1.2.1.3. Interpretationsobjektivität

1.2.2. Reliabilität

1.2.2.1. stichprobenabhängig

1.2.2.1.1. je heterogener, desto weniger stark wirkt sich die Messfehlervarianz aus

1.2.2.2. nie größer als 1

1.2.2.2.1. ab 0.7 akzeptabel

1.2.2.3. Arten

1.2.2.3.1. Split Half

1.2.2.3.2. Innere Konsistenz

1.2.2.3.3. Paralltest

1.2.2.3.4. Retest

1.2.2.4. Testverlängerung/-kürzung

1.2.2.4.1. Spearman-Brown-Formel

1.2.3. Validität

1.2.3.1. Inhaltsvalidität

1.2.3.1.1. Augenscheinvalidität

1.2.3.2. Konstruktvalidität

1.2.3.2.1. Konvergent

1.2.3.2.2. Diskriminant

1.2.3.2.3. Verdünnungsformeln

1.2.3.2.4. Multitrait-Multimethod.Ansatz

1.2.3.2.5. FAKTORENANALYSE

1.2.3.3. Kriteriumsvalidität

1.2.3.3.1. Übereinstimmungsvalidität

1.2.3.3.2. Prognostische Validität

1.2.3.4. bei Testverlängerung/-verkürzung

1.2.3.4.1. Spearman-Brown-Formel

1.2.3.5. Kosten-Nutzen-Abwägungen

1.2.3.5.1. Taylor-Russell-Tafeln

1.3. Nebengütekriterien

1.3.1. Normierung

1.3.1.1. Bespiel: Umrechnung der Normwerte (T/z/IQ/PR)

1.3.2. Ökonomie

1.3.3. Nützlichkeit

1.3.4. Zumutbarkeit

1.3.5. Unverfälschbarkeit

1.3.6. Fairness

1.3.7. Skalierung

1.4. Testkonstruktionsprozess

1.4.1. Literaturrecherche

1.4.2. Itemkonstruktion

1.4.2.1. Intuitiv

1.4.2.2. Rational

1.4.2.3. External (kriteriumsorieniert)

1.4.2.4. Internal (faktorenanalytisch)

1.4.3. Pilotierung

1.4.4. Itemanalyse/-selektion

1.4.5. Normierung

1.4.6. Validierung

2. Statistik

2.1. Skalenniveaus

2.1.1. Nominal

2.1.2. Ordinal

2.1.3. Intervall

2.1.4. Ratio/Verhältnis

2.2. Lagemaße

2.2.1. Modalwert

2.2.2. Median

2.2.3. Mittelwert

2.3. Streuungsmaße

2.3.1. Standardabweichung

2.3.2. Varianz

2.4. Zusammenhangsmaße

2.4.1. Kovarianz

2.4.2. Korrelation

2.4.3. Bestimmtheitsmaß

2.5. Konfidenzintervall

2.5.1. Je schmäler, desto genauer

2.5.2. Breite abhängig von

2.5.2.1. Varianz -> je größer desto größer die KI

2.5.2.2. Stichprobengröße -> je größer desto kleiner die KI

2.5.2.3. Irrtumswahrscheinlichkeit alpha -> je größer desto größer die KI

2.5.2.4. höhere Reliabilität -> höhere Messgenauigkeit -> engere KI

2.5.3. Arten zu schätzen (KTT)

2.5.3.1. Messfehlervarianz

2.5.3.2. Schätzfehlervarianz

2.5.3.2.1. genauer!

2.5.4. Mögliche Beispiele

2.5.4.1. KI berechnen (2 Arten)

2.5.4.2. signifikanter Unterschied zwischen zwei Leistungen?

2.5.4.2.1. KIs überlappen sich -> keine Signifikanz

2.5.4.3. welche Reliabilität wird benötigt damit ein signifikanter Unterschied vorliegt?

2.5.4.3.1. Differenz beider Testleistungen

2.6. Regression

2.6.1. Gleichung: je näher die Punkte an der Gerade, desto höher der Zusammenhang

3. Klassische Testtheorie

3.1. Axiome

3.1.1. Existenzaxiom

3.1.1.1. ein wahrer Wert existiert

3.1.2. Verknüpfungsaxiom

3.1.2.1. Leistung = wahrer Wert + Messfehler

3.1.3. Unabhängigkeitsaxiom

3.1.3.1. Wahrer Wert + Messfehler korrelieren NICHT

3.2. Zusatzannahmen

3.2.1. Unabhängigkeit zwischen...

3.2.1.1. 2 Messfehlern derselben Person

3.2.1.2. 2 Messfehlern zweier Personen

3.3. Schlussfolgerungen aus den Axiomen

3.3.1. Erwartungswert des MF = 0

3.3.2. Varianz = Varianz der wahren Werte + Varianz der Messfehler

3.3.3. Kovarianz (gemessene Werte) = Kovarianz (wahre Werte)

3.4. Äquivalenz von Messungen

3.4.1. Replikation (unrealistisch)

3.4.2. Parallelmessung

3.4.2.1. gleiche Erwartungswerte und Varianz erfassen Merkmal gleich genau

3.4.3. T-äquivalent

3.4.3.1. gleiche Erwartungswere, unterschiedliche Varianzen

3.4.4. essentiel T-parallel

3.4.4.1. Erwartungswerte unterscheiden sich durch additive Konstante gleiche Varianzen

3.4.5. essentiell T-äquivalent

3.4.5.1. Erwartungswerte unterscheiden sich durch additive Konstante unterschiedliche Varianzen

3.4.6. T-kongenerisch

3.4.6.1. Annahme, dass gleiches Merkmal gemessen wird

3.5. Kritikpunkte

3.5.1. Grundannahmen kaum prüfbar

3.5.2. Intervallskalenniveau vorausgesetzt

3.5.2.1. auch nicht prüfbar

3.5.3. stichprobenabhängig

3.5.4. Fairness der Summenbildung?

3.5.4.1. keine Unterschiede je nach Schwierigkeit eines Items

4. Faktorenanalyse

4.1. eigenständiges mathematisches Modell

4.1.1. Zusammenfassung/Gruppierung mehrerer Items zu gemeinsamen, latenten Faktoren

4.1.1.1. Ein Faktor Modell

4.1.1.2. Zwei Faktoren Modell

4.1.2. Kennwerte

4.1.2.1. Ladung

4.1.2.1.1. 1 Faktor an 1 Item

4.1.2.2. Komunalität

4.1.2.2.1. Alle Faktoren an 1 Item

4.1.2.3. Eigenwert

4.1.2.3.1. 1 Faktor an allen Items

4.1.2.3.2. Anteil des Faktors an der Gesamtvarianz

4.1.3. Methode

4.1.3.1. Parameterschätzung

4.1.3.1.1. Extraktionsverfahren

4.1.3.2. Ablauf

4.1.3.2.1. Datenerhebung

4.1.3.2.2. Parameterschätzung

4.1.3.2.3. Bestimmung Faktorenzahl

4.1.3.2.4. Faktorenrotation

4.1.3.2.5. Ergebnisinterpretation

4.1.4. Voraussetzungen

4.1.4.1. metrisch

4.1.4.2. normalverteilt

4.1.4.3. große sample size >300

4.1.4.4. Interkorrelation beachten

4.1.5. Kennwerte

4.1.5.1. Itemschwierigkeit

4.1.5.1.1. Zwischen 0 und 100

4.1.5.1.2. je höher desto leichter

4.1.5.2. Itemvarianz

4.1.5.2.1. Streuung der Antworten

4.1.5.2.2. je höher desto bessere Diskriminationsfähigkeit

4.1.5.3. Itemtrennschärfe

4.1.5.3.1. Zusammenhang zwischen den Punkten in einem Item und dem Gesamttest

4.1.5.3.2. Verdünnungsparadoxon

4.1.5.3.3. Itemselektion-Quotient

4.2. wird im Rahmen der KTT eingesetzt

4.3. zur Methode der Feststellung der Konstruktvalidität

4.4. Explorativ

4.5. Konfirmatorisch

4.6. Kritik

4.6.1. keine Aussagen über Dimensionalität

4.6.2. stichprobenabhängig

4.6.3. bildet häufig nur das Antwortverhalten ab

4.6.4. Subjektivität

4.6.5. Voraussetzungen

5. Moderne Testtheorie Item-Response-Theory

5.1. Unterschiede zur KTT

5.1.1. geht von Antworten einzelner Items aus

5.1.2. Annahmen können überprüft werden

5.1.3. probabibilistisch

5.1.3.1. arbeitet mit Lösungswahrscheinlichkeiten

5.1.3.2. Lösung = abhängig von Fähigkeit der Person

5.1.3.2.1. eindimensional!

5.1.4. WIE kommt es zu einem Testergebnis (IRT)

5.2. Grundidee: Lösungswahrscheinlichkeit =

5.2.1. Personenfähigkeit

5.2.2. Itemschwierigkeit

5.2.3. Zufall

5.3. Itemcharakteristik ICC

5.3.1. Zusammenhanng zwischen Ausprägung und der Wahrscheinlichkeit für eine bestimmte Antwort wird beschrieben

5.3.1.1. streng monoton

5.3.1.2. monoton

5.3.1.3. nicht monoton

5.4. Grundannahme

5.4.1. Lokal stochastische Unabhängigkeit (meiste IRT-Modelle)

5.4.1.1. Lösungswahrscheinlichkeit nicht davon abhängig, ob das vorherige Item gelöst wurde

5.4.1.2. Items dürfen nicht aufeinander aufbauen

5.4.1.3. Reihenfolge der Items egal

5.5. Modelle

5.5.1. Guttman Skala

5.5.1.1. Vorläufer

5.5.1.2. deterministisch

5.5.1.3. ICC = Sprungfunktion

5.5.2. Latent Distance Model

5.5.2.1. probabilisitisch

5.5.2.2. ICC = Sprungfunktion

5.5.2.3. Lösungswahrscheinlichkeiten werden geschätzt

5.5.2.4. erlaubt zufällige (Nicht-)Lösung

5.5.3. Rasch Modell

5.5.3.1. Probabilisitisch

5.5.3.2. ICC = Logistische Funktion

5.5.3.2.1. streng monoton

5.5.3.2.2. Fähigkeit steigt -> LWK steigt

5.5.3.2.3. man kann sich auch die Wahrscheinlichkeit anschauen, dass ein Item nicht gelöst wird

5.5.3.3. Ursprung: Messmodell für dichotome Items

5.5.3.4. Hauptanforderungen

5.5.3.4.1. Spezifische Objektivität

5.5.3.4.2. erschöpfende, suffiziente Statistiken

5.5.3.5. Vorteil

5.5.3.5.1. einfache Konstruktion von Paralleltest

5.5.3.5.2. ermöglicht adaptives Testen

5.5.3.6. Parameterschätzung

5.5.3.6.1. Lösungshäufigkeiten

5.5.3.6.2. Maximum-Likelihood-Methode

5.5.3.6.3. Informationsfunktion

5.5.3.7. Modellkontrollen

5.5.3.7.1. grafisch

5.5.3.7.2. Wald-Type-z

5.5.3.7.3. Likelihood Quotienten Test

5.5.3.7.4. Martin-Löf

5.5.4. Birnbaum Modelle

5.5.4.1. basiert auf dem Rasch-Modell

5.5.4.1.1. statt einem Parameter werden zwei bzw. drei Paramater geschätzt

5.5.4.2. IC-Kurven dürfen sich schneiden

5.5.5. linear logistisches Modell

5.5.6. Partial Credit Modell

5.5.6.1. basiert auf dem Rasch-Modell

5.5.6.2. für ordinale Daten

5.5.6.2.1. Überprüfung dessen möglich

5.5.6.3. Teilpunkte möglich

5.5.6.4. IC Kurven = Schwellen

5.5.6.4.1. Ratingskalen-Modell

5.5.6.4.2. Äquidistanz-Modell

5.5.6.4.3. Dispersionsmodell

oder Registrieren