Читать книгу Erstellung von Fragebogen - K. Wolfgang Kallus - Страница 13
1.5 Messinformation von Fragebogen: Items, Subtest und Bereichssubtest
ОглавлениеZiel eines psychometrischen Fragebogens ist es, unterschiedliche Merkmalsausprägungen von Eigenschaften, Einstellungen und Meinungen, Bewertungen, Verhaltenstendenzen, Zuständen oder längerfristigen Reaktions- oder Stimmungslagen bei Personen oder Personengruppen repräsentativ zu erfassen und zahlenmäßig wiederzugeben. Dabei kann es sich um Unterschiede im Zeitverlauf (Veränderungen) handeln oder um Unterschiede zwischen Personen oder Personengruppen.
Zu diesem Zweck werden bei einem Fragebogen die Werte für zusammengehörige Items zu einem Messwert, dem Subtestwert, verrechnet. Diese Zusammenfassung von Items zu einem sog. Subtest bildet die Grundlage, um die Güte der Fragen mit den Verfahren der Klassischen Testtheorie (Lord & Novick, 1968) zu analysieren. In der Regel umfasst ein Fragebogen mehrere Subtests, um einen Merkmalsbereich in seinen unterschiedlichen Facetten abzubilden. Jeder Subtest entspricht einer Facette des Merkmals. Das Konzept der Subtests stellt den Unterschied des „Bogens mit Fragen“ zum psychometrischen Fragebogen her.
Den Antworten werden bei jedem Item für die Auswertung Zahlen zugeordnet. Rein technisch werden bei zahlenmäßig vorgegebenen Antworten die Zahlenvorgaben der Antworten gewählt. Diese Konvention ist jedoch messtheoretisch nicht zwingend, da bei einer Intervallskala und natürlich auch bei einer Rangskala die Zahlenzuordnung weit beliebiger ist (vgl. Kap. 3.4). Bei der Auswertung und der Bestimmung der Güte eines Fragebogens geht der Untersuchende explizit oder implizit von den Grundannahmen („Axiomen“) der Klassischen Testtheorie aus. Die Axiome der Klassischen Testtheorie sind in Abbildung 1 dargestellt. Diese sind/lauten:
– Messwert x: Dieser wird additiv in den wahren Wert t und den Messfehler e zerlegt (x = t+e).
– Messfehler und wahrer Wert sind unabhängig.
– Messfehler zweier Items sind unabhängig.
Abbildung 1: Axiome der Klassischen Testtheorie (Kallus, 2016)
Die Axiome der Klassischen Testtheorie in Abbildung 1 fassen die Annahmen für zwei Items grafisch in Anlehnung an Steyr und Eid (2001) zusammen. Der aus der Antwort bestimmte Messwert eines Items zerfällt in Fehler und wahren Wert. Ein Subtest besteht aus zwei oder mehr Items, die jeweils eine wichtige Facette des zu messenden Merkmals (z.B. Prüfungsangst) beitragen. Abbildung 1 verdeutlicht, dass weder die Messfehler (z.B. durch unklare Itemformulierungen) mit dem wahren Wert zu tun haben noch untereinander abhängig sein dürfen (z.B. durch komplexe Syntax oder doppelte Verneinungen in beiden Fragen).
In manchen Messmodellen wird ein Teil der Antworten bei einem Item zusätzlich einem spezifischen Anteil zugeschrieben, der zwar zuverlässig erfasst wird, aber nichts Gemeinsames mit allen anderen Items des Subtests hat. Diese spezifische Arbeit wird jedoch in den meisten Auswertungsmodellen nicht berücksichtigt (vgl. Steyr & Eid, 2001; Eid & Schmidt, 2014).
Eine grafische Darstellung für den Subtest „Allgemeine Beanspruchung“ des Erholungs-Belastungs-Fragebogens (EBF; Kallus, 1995, 2016) zeigt Abbildung 2. Dieser Fragebogen bildet den gegenwärtigen Beanspruchungs-/Erholungszustand einer Person ab. Die Subtests des EBF in der Form mit 48 Items bestehen aus je vier Items. Jedes Item wird zerlegt in Messfehler und den wahren Wert, wobei spezifische Varianzanteile dem Fehler zugerechnet sind. Die Zahlen an den Pfeilen in Abbildung 2 verdeutlichen die Gewichte, mit denen die Items zum Subtest „Allgemeine Beanspruchung“ beitragen. Bei der Prüfung dieses Modells durch die statistische Prozedur der „linearen Strukturgleichungsmodelle“ ergab sich ein gutes Ergebnis. Zusammenfassend kann festgehalten werden, dass ein Subtestwert durch die additiv zusammengefassten Werte von mindestens zwei Items gebildet wird.
Abbildung 2: Messmodell für „Allgemeine Beanspruchung“ (Kallus, 2016, S. 66)
Ein Fragebogen wie der EBF umfasst in der Regel mehrere solcher Subtests. Für den EBF wird „Beanspruchung“ theoriegeleitet in Anlehnung an die Klassifikationen von Stress nach Janke (1976) in insgesamt sieben Facetten (Subtests) abgebildet. Die Gesamtheit der Subtests soll den zu messenden Merkmalsbereich über Feststellungen oder Fragen in einem Profil oder Gesamtwert angemessen zahlenmäßig repräsentieren. „Erholung“ umfasst insgesamt fünf Subtests. Alle zwölf Subtests werden in der Regel gemeinsam betrachtet und in einem grafischen Subtestprofil zusammengefasst. Ein Profil lässt sich darstellen, indem die Subtestwerte einer Person oder einer Gruppe in ein Profilschema eingetragen und diese Werte verbunden werden. Details zur Darstellung und Interpretation von Fragebogenprofilen werden in Kapitel 5.4 besprochen. Wenn aus Gründen der Vereinfachung auf die Detailinformation aus den Subtests verzichtet werden soll, ist es möglich, Facetten des Merkmals zusammenzufassen und übergeordnete Werte zu bilden. Die in einen Bereich gehörenden Subtests werden dann zu Bereichssubtests zusammengefasst. Auf diese Weise kann aus dem Erholungs-Belastungs-Fragebogen ein sinnvoller Gesamtwert für sozial-emotionale Beanspruchung gebildet werden. Die Struktur dieses Subtests zeigt Abbildung 3. Für die übergeordneten Werte soll im Folgenden der Begriff des Bereichssubtests verwendet werden. (Anmerkung: Bei älteren Fragebogenverfahren wurde in Anlehnung an den angloamerikanischen Sprachgebrauch der Begriff „Skala“ auch alternativ zum Subtestbegriff benutzt. Der Begriff Skala wird in dieser Arbeit nur zur Bezeichnung der Antwortformate verwendet, z. B. „Intensitätsskala“. Diese Festlegung ist mit der Begriffswelt der linearen Skalierung kompatibel, da bereits auf Itemebene eine erste zahlenmäßige Repräsentation von Merkmalsunterschieden stattfindet.)
Tabelle 1: Subtests des Erholungs-Belastungs-Fragebogens (EBF-Basic)
Subtest (Itemzahl) | Bezeichnung (Abkürzung) |
1 (k=4) | Allgemeine Beanspruchung – Niedergeschlagenheit (BEA-ALLG) |
2 (k=4) | Emotionale Beanspruchung (BEA-EMO) |
3 (k=4) | Soziale Spannungen (BEA-SOZ) |
4 (k=4) | Ungelöste Konflikte – Erfolglosigkeit (KONFL) |
5 (k=4) | Übermüdung – Zeitdruck (ÜMÜDG) |
6 (k=4) | Energielosigkeit – Unkonzentriertheit (ENLOS) |
7 (k=4) | Körperliche Beschwerden (BEA-SOM) |
8 (k=4) | Erfolg – Leistungsfähigkeit (ERFOLG) |
9 (k=4) | Erholung im sozialen Bereich (ERH-SOZ) |
10 (k=4) | Körperliche Erholung (ERH-SOM) |
11 (k=4) | Allgemeine Erholung – Wohlbefinden (ERH-ALLG) |
12 (k=4) | Erholsamer Schlaf (SCHLAF) |
Statistisch wird die Frage, ob Items zu einem Bereich gehören und ob es sinnvoll ist, Subtests zu einem Bereich zusammenzufassen, auf Basis von Kovarianzen bzw. Korrelationen entschieden. Korrelationen bilden die linearen Zusammenhänge zwischen den Items (oder Subtests) ab. Eine Vielzahl von paarweisen Korrelationen (d. h. die Korrelationsmatrix) kann schnell sehr unübersichtlich werden. Als einfache Methode zur Strukturierung von Korrelationsmatrizen hat sich die sog. Faktorenanalyse etabliert. Die Faktorenanalyse sucht nach voneinander relativ unabhängigen Gruppierungsvariablen, zu denen sich die zum Faktor gehörenden Variablen zusammenfassen lassen. So bilden beispielsweise Erholung und Beanspruchung in Faktorenanalysen bei unterschiedlichen Stichproben immer wieder zwei (relativ unabhängige) Faktoren.
Aus diesem Grund ist eine weitere Zusammenfassung zu einem Gesamtwert nicht sinnvoll, sondern der aktuelle Zustand der Person lässt sich nur über eine Kombination aus beiden Werten charakterisieren. Beanspruchung „zerfällt“ in der Regel noch in je einen Faktor für „sozial-emotionale Beanspruchung“ und „leistungsbezogene Beanspruchung“.
Exkurs
Die Merkmalsstruktur stellt ein lineares Strukturgleichungsmodell anschaulich und präzise dar (Abbildung 3). Dabei wird oft zwischen Messmodell (in Abbildung 2 für „Allgemeine Beanspruchung“) und dem Strukturmodell für den Merkmalsbereich unterschieden. Strukturgleichungsmodelle zeigen Hinweise auf Verletzungen der Annahme der Klassischen Testtheorie in Form von Messfehlerkorrelationen (siehe dazu auch Wagner, Jiménez, Kallus & Kellmann, 2016).
Abbildung 3: Messmodell für „sozial-emotionale Beanspruchung“ (Kallus, 2016, S. 68)
Wie am Beispiel des EBF aufgezeigt wurde, lassen sich hoch korrelierende Subtests in vielen Fällen zu Bereichssubtests für den Merkmalsbereich oder für latente Variablen eines psychologischen Konzepts zusammenfassen. In älteren Arbeiten wurde statt des Begriffs der latenten Variablen auch der Begriff der (latenten) Dimension verwendet, um ein psychologisches Konzept wie z. B. Stress theoretisch zu beschreiben. Wenn alle Subtests hoch korrelieren, ergibt sich bei der Faktorenanalyse ein „Generalfaktor“ (der den Großteil der Varianz auf sich „vereint“). In diesem Fall ist ein einziger Gesamtwert sinnvoll. Ein solcher Gesamtwert ergibt sich z. B. für den Teamqualitätsfragebogen (Kallus & Brandt, 2006), da hier alle Subtests hoch korrelieren.
Die Güte von Subtests, von Bereichssubtests und von einem Gesamtwert lassen sich mit den Methoden der Klassischen Testtheorie überprüfen, wobei in der Analyse in der Regel die Items auch für die Gesamtwerte und die Bereichssubtests als Dateneinheiten verwendet werden. Der Einsatz der Faktorenanalyse und linearer Strukturgleichungsmodelle in der Fragebogenkonstruktion wird in Kapitel 6.4 aufgegriffen. Die Statistik der Fragebogenentwicklung steht jedoch hinter der Entwicklung eines inhaltlich und theoretisch fundierten Systems von angemessenen Fragen zurück.