Ratingskalen
Version vom 16. Februar 2016, 22:23 Uhr von Diana (Diskussion | Beiträge)
Ratingskalen
Ratingskalen werden verwendet, wenn ein Konstrukt direkt gemessen (beurteilt) werden soll. Soll zum Beispiel die Zufriedenheit Studierender mit ihrer Studienstadt untersucht werden, wird direkt gefragt: Wie sehr stimmen Sie der Aussage zu: "Ich fühle mich in Dresden wohl.". Ratingskalen sind einerseits direkt und unkompliziert, allerdings ist strittig, ob sie auf Ordinal- oder Intervallniveau messen. Beim erstellen von Ratingskalen gibt es eine Reihe von Möglichkeiten, die zu bedenken sind:
Polarität - Welchen Bereich beschreibt die Ratingskala?
- unipolar - “große Ausprägung” bis “keine Ausprägung” bzw. -5 bis 5
- bipolar - “stark positive Ausprägung” bis “stark negative Ausprägung” bzw. 0 bis 5
Marken - Wie werden die Stufen der Skala dargestellt?
- numerisch - der Ausprägung wird ein numerischer Wert zwischen vorgegebenen Grenzwerten zugewiesen, (z.B. -2,-1,0,1,2 oder 1,2,3,4,5)
- verbal - Der Ausprägung wird eine verbale Beschreibung zugeordnet (z.B. trifft völlig zu, …, trifft überhaupt nicht zu oder nie, …, sehr oft)
- symbolisch - Es wird ein Symbol ausgesucht, das die Ausprägung am besten beschreibt (z.B. “Wie fühlen Sie sich?” im Bereich lachendes Gesicht bis trauriges Gesicht)
- grafisch - die Ausprägung soll grafisch dargestellt werden (zum Beispiel frei einen Punkt auf einer Strecke zwischen zwei Polen wie “starke Abneigung” und “starke Zuneigung” wählen)
Verankerung - Wie wird die Skala im Test eingebunden?
- Extrem- oder Stufenbeispiele - Gibt es gestufte Beispiele (z.B. nie, selten, gelegentlich, oft, immer) oder Extrembeispiele, zwischen denen sich positioniert werden soll? (z.B große Schmerzen … keine Schmerzen, oft bei grafischen Marken)
- Art der Verankerung - Auf welche Weise werden Ratingskalen veranschaulicht oder mit Beispielen unterstützt. Anker können Zeichnungen, Fotos, aber natürlich auch Textbeispiele sein.
Stufen - Wie viele Stufen soll es geben?
- Die am häufigsten diskutierte Frage ist hier, ob eine gerade Anzahl an Stufen genutzt werden soll oder eine ungerade. Bei einer ungeraden Anzahl an Stufen gibt es eine Mittelkategorie, sodass es z.B. bei Unsicherheit möglich ist, einfach auf die Mittelkategorie auszuweichen (zentrale Tendenz oder Tendenz zur Mitte). Bei einer geraden Anzahl gibt es diese Möglichkeit nicht, sodass die beurteilende Person gezwungen ist, sich zu entscheiden in welche Richtung sie eher tendiert. Ist also bei den Urteilern eine hohe zentrale Tendenz zu erwarten, die das Ergebnis zu verfälschen droht, dann ist der Verzicht auf eine mittlere Stufe als einfachster Weg zur Vermeidung der zentralen Tendenz empfehlenswert.
- Ein weiteres Problem ist das Ambivalenz-Indifferenz-Problem, also das Problem, dass bei Wahl einer neutralen Kategorie nicht klar ist, ob der Urteiler der Meinung ist, dass es keine Tendenz gibt, oder ob er sich nicht positionieren kann oder will. Wird beispielsweise eine Lehrerin befragt, die Leistungsbereitschaft ihrer Schüler einzuschätzen, und wählt auf einer Skala von faul bis engagiert den neutralen Wert, so ist nicht klar, ob ihre Meinung ist, dass der Schüler mal sehr faul und mal sehr engagiert ist (ambivalent) oder ob sie dazu keine klare Meinung hat (indifferent). Eine Möglichkeit ist hier beispielsweise eine zusätzliche Stufe wie “Ich kann dazu kein klares Urteil abgeben”
- Eine größere Stufenanzahl ermöglicht einerseits ein genauere Differenzierung, kann andererseits aber zu einer Einschränkung von Reliabilität und Validität führen, wenn eine so genau Differenzierung für die einschätzende Person gar nicht mehr möglich ist. Allgemein sind in den meisten Fällen 5-7 Stufen üblich und empfehlenswert.