Testkonstruktion: Unterschied zwischen den Versionen

Aktuelle Version vom 18. November 2021, 16:40 Uhr

Die Entwicklung eines Tests folgt den Kriterien für die Konstruktion einer Skala: schließlich nimmt man an, dass man ein Merkmal auf einer bestimmten Skala messen kann.
Das Vorgehen sieht aus wie folgt:

Man beginnt mit der Definition der Merkmale, die erhoben werden sollen. Dies sollte so genau wie möglich geschehen, da der gesamte Test darauf aufbaut.
Es reicht beispielsweise nicht, „Ängstlichkeit“ erheben zu wollen – eine operationale Definition des Begriffs als „Ausmaß der emotionalen Reaktivität und des Vermeidungsverhaltens in bedrohlichen Situationen, sowie Häufigkeit und Intensität von subjektivem ängstlichem Befinden“ bildet eine bessere Basis für die weitere Konstruktion und wird zu weniger Missverständnissen oder Widersprüchen führen.
Es folgt eine Literaturrecherche, um einen Eindruck des momentanen Wissenstandes bezüglich der Merkmale zu erlangen. Außerdem muss selbstverständlich überprüft werden, ob ein vergleichbarer Test, zu dem den man konstruieren möchte, nicht bereits existiert und genutzt werden sollte.

Nun geht es an die eigentliche Itementwicklung.
Es gibt verschiedene Wege, Items zu formulieren:

Offene Items enthalten keine Antwortvorgaben und somit auch keine richtigen oder falschen Antworten. Sie sind schwierig auszuwerten und natürlicherweise wenig objektiv, weshalb man sie vorwiegend in explorativen Kontexten verwendet. (Beispiel: „Was halten Sie von Horoskopen?“) Die Antworten können dann ggf. zur Entwicklung von geschlossenen Items verwendet werden.
Halboffene Items lassen die Versuchsperson ihre Antwort ebenfalls frei formulieren – jedoch gibt es hier nur eine richtige Antwort. Diese Art von Items sind zumindest objektiver als komplett offene, und etwas leichter auszuwerten – wenn auch verschiedene Nuancen in den Antworten die klare Bewertung erschweren. Man greift hier häufig auf ein Punktesystem zurück. (Beispiel: „Was versteht man unter Metamorphose?“)
Multiple Choice Items sind verhältnismäßig objektiv und vor allem ökonomisch. Die Antwortmöglichkeiten sind klar vorgegeben und es ist deutlich, welche davon richtig und welche falsch sind. Eine Bewertung ist somit recht unkompliziert. Erreicht werden sollte, dass eine komplett uninformierte Person alle Antworten mit gleicher Wahrscheinlichkeit wählt – falsche Antworten (Distraktoren) müssen also gut „getarnt“ werden. Trotzdem kann es immer noch passieren, dass eine Antwort nur gewählt wird, weil sie vertraut vorkommt (und nicht aufgrund des Wissens, dass sie richtig ist). Außerdem muss beachtet werden, dass ein gewisser Anteil richtiger Antworten durch zufälliges Raten entstehen können - deshalb ist hier ggf. eine Item-Ratekorrektur notwendig. (Beispiel: „Wie nennt man die Vorgeschichte einer Erkrankung? A) Amnesie B) Anamnese C) Anonymität )
Rating-Skalen erlauben differenzierte Antworten, jedoch können bei der Skalierung und beim Einsatz von Skalen auch Probleme auftauchen.

Bei der genauen Formulierung der Items gilt es, die Kriterien für die Formulierung von Items zu beachten.
Schließlich werden die Items dahingehend analysiert, ob sie die minimalen Anforderungen an eine Skala erfüllen und für den nachfolgenden Gebrauch normiert

@@ Zeile 1: / Zeile 1: @@
 {{Nav|Navigation|Tests|Tests}}
-Die Entwicklung eines Tests folgt den Kriterien für die [[Konstruktion einer Skala]]: schließlich nimmt man an, dass man ein Merkmal auf einer bestimmten Skala messen kann.
+Die Entwicklung eines Tests folgt den Kriterien für die [[Skalierung|Konstruktion einer Skala]]: schließlich nimmt man an, dass man ein Merkmal auf einer bestimmten Skala messen kann.
 <br/>Das Vorgehen sieht aus wie folgt:
-<br/> [[Datei:Testkonstruktion.png|600px]]
+<br/> [[Datei:Testkonstruktion.png|600px|link=Ausgelagerte_Bildbeschreibungen#Testkonstruktion|Ausgelagerte Bildbeschreibung von Testkonstruktion]]
 <br/>Man beginnt mit der '''Definition''' der Merkmale, die erhoben werden sollen. Dies sollte so genau wie möglich geschehen, da der gesamte Test darauf aufbaut.
@@ Zeile 15: / Zeile 15: @@
 *'''Multiple Choice''' Items sind verhältnismäßig objektiv und vor allem ökonomisch. Die Antwortmöglichkeiten sind klar vorgegeben und es ist deutlich, welche davon richtig und welche falsch sind. Eine Bewertung ist somit recht unkompliziert. Erreicht werden sollte, dass eine komplett uninformierte Person alle Antworten mit gleicher Wahrscheinlichkeit wählt – falsche Antworten (Distraktoren) müssen also gut „getarnt“ werden. Trotzdem kann es immer noch passieren, dass eine Antwort nur gewählt wird, weil sie vertraut vorkommt (und nicht aufgrund des Wissens, dass sie richtig ist). Außerdem muss beachtet werden, dass ein gewisser Anteil richtiger Antworten durch zufälliges Raten entstehen können - deshalb ist hier ggf. eine [[Item-Ratekorrektur]] notwendig. ''(Beispiel: „Wie nennt man die Vorgeschichte einer Erkrankung? A) Amnesie B) Anamnese C) Anonymität )''
 *'''Rating-Skalen''' erlauben differenzierte Antworten, jedoch können bei der [[Skalierung]]  und beim Einsatz von [[Skalen]] auch [[Messtheorie|Probleme]] auftauchen.
-<br/>Bei der genauen Formulierung der Items gilt es, die Kriterien für die Formulierung von [[Items]] zu beachten.
+<br/>Bei der genauen Formulierung der Items gilt es, die Kriterien für die Formulierung von Items zu beachten.
-<br/>Schließlich werden die Items dahingehend '''analysiert''', ob sie die minimalen [[Skalenanforderungen|Anforderungen an eine Skala]] erfüllen und für den nachfolgenden Gebrauch [[Normierung|normiert]]
+<br/>Schließlich werden die Items dahingehend '''analysiert''', ob sie die minimalen [[Skalierung|Anforderungen an eine Skala]] erfüllen und für den nachfolgenden Gebrauch [[Normierung|normiert]]

Testkonstruktion: Unterschied zwischen den Versionen

Aktuelle Version vom 18. November 2021, 16:40 Uhr

Navigationsmenü

Suche