Читать книгу Quantitative Methoden in der Erziehungswissenschaft - Claudia Schuchart - Страница 18
3.2 Merkmalserfassung
ОглавлениеVariablen, Indikatoren und Index
Die verschiedenen Ausprägungen einer Eigenschaft werden Variablen genannt. Variablen selbst können in dichotome (zwei Ausprägungen, z.B. nicht verheiratet/verheiratet), kategoriale beziehungsweise diskrete (nur bestimmte ganzzahlige Werte, beispielsweise bei Noten) oder stetige (jeder beliebige Zahlenwert, z.B. Gewicht) unterschieden werden. Werden direkt beobachtbare Merkmale wie Alter oder Zeit erfasst, so handelt es sich um manifeste Variablen. Merkmale, die nicht direkt beobachtbar sind, werden als latente Variablen bezeichnet. In der Erziehungswissenschaft haben wir es fast ausschließlich mit latenten Variablen zu tun. So sind beispielsweise Persönlichkeitsmerkmale wie Intelligenz oder Kompetenzen nicht direkt beobachtbar, sondern nur indirekt erfassbar, indem Merkmale – Indikatoren – gemessen werden, von denen man theoretisch fundiert annimmt, dass sie auf die eigentlich interessierenden Merkmale schließen lassen. Im vorigen Kapitel wurde im Zusammenhang der Operationalisierung eines Begriffs auf die Bedeutung von Indikatoren bereits kurz eingegangen.
Indikator – theoretisches Konzept
In diesem Sinne könnte die Anzahl der in einem Haushalt befindlichen Bücher als Indikator für das häusliche intellektuelle Anregungsniveau angesehen werden. Hinter dieser Annahme steht das theoretische Konzept des „kulturellen Kapitals“ nach Pierre Bourdieu, der davon ausgeht, dass die Verfügung über kulturelles Kapital den Erwerb von in der Schule vermittelten Kompetenzen und Fähigkeiten erleichtert. Kulturelles Kapital kann in materialisierter Form (z.B. Gemälde oder Bücher), in inkorporierter Form (z.B. Kleidungsstil, Gesten und Verhalten) und in institutionalisierter Form (z.B. Bildungsabschlüsse) vorliegen. Angenommen wird nun, dass die Anzahl der Bücher anzeigt, in welchem Ausmaß die Familie über kulturelles Kapital verfügt. Die PISA-Befunde haben gezeigt, dass ein sehr starker Zusammenhang zwischen der Leseleistung und der Bücherzahl im Haushalt zu beobachten ist. Nun könnte daraus geschlossen werden, dass Kindern mit schwachen Leseleistungen einfach ein Regal voller Bücher geschenkt werden sollte. An diesem Punkt werden die Grenzen des Erklärungsgehalts von Indikatoren sichtbar: Die Anzahl der Bücher besagt ja noch nicht, ob sie überhaupt gelesen werden. Entsprechend dem theoretischen Ansatz müsste also neben der Gabe von Büchern auch die „Lesekultur“ in der Familie verändert werden.
Index
Merkmale können auch über eine Verbindung mehrerer einzeln gemessener Merkmalsaspekte – einem Index – erfasst werden. Ein bekanntes Beispiel ist der Internationale Sozioökonomische Index des beruflichen Status (ISEI: International Socio-economic Index of Occupational Status, vgl. GANZEBOOM et al. 1992). Ganzeboom und seine Mitarbeiter gehen davon aus, dass alle Berufe auf einer eindimensionalen metrischen Statusskala abgebildet werden können und bspw. der gesellschaftliche Status des Tischlerberufs mit dem Status des Klempnerberufs verglichen werden kann. Die Entwicklung dieser Skala fußt auf dem theoretischen Konzept, dass sich der Status eines Berufs einerseits nach dem Einkommen als Indikator für unterschiedliche Lebensbedingungen und andererseits nach den Bildungs- und Berufsqualifikationen als einkommensgerierende Ressourcen richtet. Beide Merkmale allerdings variieren mit dem Alter. Es muss daher berücksichtigt werden, dass ältere Personen – z.B. aufgrund längerer Dienstzeiten – ein höheres Gehalt beziehen als jüngere Personen mit der gleichen Qualifikation. Daher wurden für die Indexbildung die Alterseffekte kontrolliert. Im Ergebnis kann jeder Person ein Wert zugewiesen werden, der über ihre gesellschaftliche Statusposition Auskunft gibt. So würde eine Person, die mit einem Realschulabschluss die Ausbildung zur Krankenschwester absolviert hat, diesen Beruf ausübt und etwa 1800 Euro im Monat verdient, einen geringeren Skalenwert erhalten als eine gleichaltrige Person mit demselben Schulabschluss, aber einer Anstellung als Oberschwester und einem höheren Gehalt.
Messung latenter Merkmale
Aus dem Vorangegangenen wird ersichtlich, dass für die Erfassung von latenten bzw. komplexen Merkmalen in der Regel eine einzige Frage nicht ausreicht. Dies soll an einem weiteren Beispiel verdeutlicht werden. Wenn der in einer Klasse wahrgenommene Leistungsdruck gemessen werden soll, genügt es nicht, die Schüler zu fragen: „Empfindet Ihr Leistungsdruck?“, da im Nachhinein nicht festgestellt werden kann, was die Schüler mit dieser Frage verbinden – ob sie mit einer Bejahung eher Angst, Stress oder „nur“ viele Hausaufgaben verbinden, ob sie diesen Leistungsdruck auf ihre Eltern oder auf die Lehrer beziehen etc. Daher wird nicht ersichtlich, welche möglichen Dimensionen von „Leistungsdruck“ eigentlich erfasst werden. Hier zeigt sich bereits eine wichtige Anforderung an das Messen schwer zugänglicher Merkmale: Es darf nur jeweils eine Dimension erfasst werden. Aufgrund einer vorausgehenden Operationalisierung (vgl. Kap. 2) muss der Forscher daher versuchen, die ihn interessierende Dimension des Konstrukts durch verschiedene Fragen möglichst genau „einzukreisen“. Die Antworten, übersetzt in ein numerisches Relativ (z.B. 1 = stimme zu, 2 = weiß nicht, 3 = stimme nicht zu), müssen auf einer eindimensionalen Skala abgebildet werden. Bei der Übersetzung von inhaltlichen Angaben zu Zahlenwerten sind weitere Regeln zu beachten.
Skalen – Skalierung
Messen ist, wie schon gesagt wurde, mit der Zuweisung von Beobachtungen zu Zahlenwerten verbunden. Können in einem Mathematiktest für 20 richtige Antworten insgesamt 20 Punkte erreicht werden, dann erhält man bei 3 Fehlern nur noch 17 Punkte. Die Überführung der richtigen Antworten in Zahlen entspricht einer strukturgleichen Abbildung. Graphisch kann man sich eine strukturgleiche Abbildung als horizontale Achse vorstellen, auf deren Abschnitte dann die Ausprägungen aufgetragen werden. Diese Achse bildet eine Skala; die Funktionswerte sind Skalenwerte oder Messwerte. Wichtig ist die Benennung von Regeln, die im empirischen Relativ erfüllt sein müssen, damit es in ein numerisches Relativ überführt werden kann. So kann bspw. festgelegt werden, dass mit zunehmender Punktezahl in einem Lesetest eine höhere Leseleistung verbunden ist. Demzufolge müsste bei einer maximalen Punktzahl von 100 Punkten ein Schüler mit 67 Punkten eine schlechtere Leseleistung aufweisen als ein Schüler mit 82 Punkten, der erstgenannte Schüler erzielt aber eine bessere Leistung als ein Schüler mit 44 Punkten. Diese Regel wäre verletzt, wenn der zweite Schüler besser lesen könnte als der dritte Schüler. Die Punkteanzahl könnte auch inhaltlich durch sogenannte „Kompetenzstufen“ definiert werden. Im Lesetest der internationalen Leistungsstudie IGLU waren Schüler mit 375–450 Punkten lediglich in der Lage, „gesuchte Wörter in einem Text zu erkennen“, was als Kompetenzstufe I bezeichnet wurde. Schüler mit 451–525 Punkten konnten darüber hinaus „angegebene Sachverhalte aus einer Textpassage erschließen“ (Kompetenzstufe II). Eine höhere Kompetenzstufe gibt also an, dass die Lesefähigkeiten eines Schülers auch höheren Anforderungen genügen.
Die Genauigkeit einer Messung hängt einerseits von der Systematisierung der Zuordnung (d.h. wie gut gelingt die Übertragung des empirischen in ein numerisches Relativ) und andererseits von der Art der Daten ab. Allgemein werden vier Arten von Skalen unterschieden: Die Nominalskala, die Ordinalskala, die Intervallskala und die Ratioskala. Mit diesen Skalentypen ist auch festgelegt, welche mathematischen Operationen mit ihnen durchgeführt werden können.
Nominalskala
Eine Nominalskala liegt dann vor, wenn die möglichen Ausprägungen eines Merkmals zwar unterschieden, aber nicht in eine größer-kleiner Beziehung gebracht werden können. Wie bereits der Name sagt – Nominal kommt vom lateinischen „Nomen“ = Name – stellt die Zuordnung der Zahlen lediglich eine Benennung von Objekten in Bezug auf ein Merkmal dar. Ein Beispiel wäre das Geschlecht. Jeder Befragungsteilnehmer muss sich eindeutig einer der beiden Kategorien männlich/weiblich zuordnen und kann nicht gleichzeitig beiden Kategorien angehören. Den beiden Kategorien können beliebige Zahlen zugeordnet werden (eine einmal getroffene Zuordnung muss jedoch beibehalten werden), da sie nur eine Benennung darstellen. Mit Nominalskalen können nur einfache mathematische Transformationen durchgeführt werden, beispielsweise absolute und relative Häufigkeiten berechnet werden, z.B. von 120 Befragten waren 72 männlich (60%) und 48 weiblich (40%).
Ordinalskala
Auch bei Ordinalskalen werden Objekte, die bezüglich einer bestimmten Ausprägung gleich sind, einer Kategorie zugewiesen. Darüber hinaus müssen die Objekte in Bezug auf das interessierende Merkmal jedoch in eine Rangfolge gebracht werden, also geordnet werden können. Die Zuordnung der Zahlen muss lediglich diese Rangreihe wiedergeben; wie groß der Abstand zwischen den einzelnen Kategorien ist, geht aus dieser Zuordnung nicht hervor. Ein Beispiel wäre die folgende Skala zur Erfassung der Häufigkeit des „Schulschwänzens“. Auf die Frage „Wie oft schwänzt Du die Schule?“ kann geantwortet werden: oft (1), selten (2), nie (3). Ein Schüler, der die (1) ankreuzt, bleibt öfter der Schule fern als ein Schüler, der die (2) angekreuzt hat, ohne dass aus dieser Angabe hervorgeht, wie viel er schwänzt. Unterstellt wird bei dieser Fragestellung, dass die befragten Schüler eine einheitliche Vorstellung davon haben, wann seltene Abwesenheit zu häufiger Abwesenheit wird. Da dies nicht gewährleistet ist, sollte man solche uneindeutigen Fragestellungen in Untersuchungen vermeiden.
Intervallskala
Führen die Antworten auf eine Frage zu einer Ordinalskala, dann können nur solche mathematischen Transformationen durchgeführt werden, die die Rangfolge der Ausprägungen erhalten.
Für eine Intervallskala dagegen müssen die Möglichkeiten der Unterscheidung und der Rangordnung gegeben sein, zusätzlich müssen die Intervalle zwischen zwei beliebigen aufeinander folgenden Ausprägungen gleich groß sein. Daher soll auch zwischen zwei benachbarten Zahlen immer die gleiche Differenz liegen. Ein geeignetes Beispiel ist hier die Temperaturmessung, die in Grad Celsius oder Fahrenheit vorgenommen werden kann. In der erziehungswissenschaftlichen Forschung hat beispielsweise der Intelligenzquotient Intervallskalenniveau. Mathematische Operationen, die mit Intervallskalen durchgeführt werden können, dürfen die Größe der Intervalle entweder gar nicht oder alle Intervalle nur im selben Maß verändern.
Ratioskala
Auch bei Intervallskalen sind Aussagen über Verhältnisse, bspw. „gestern war es doppelt so warm (8 Grad Celsius) wie heute (4 Grad Celsius)“, nicht möglich, da es auf ihnen keinen natürlichen Nullpunkt gibt. Diese Voraussetzung trifft nur bei der letzten der hier vorzustellenden Skalen zu, der Ratioskala. Mit ihrer Hilfe können, wie bereits der Name – Verhältnisskala – sagt, Verhältnisse zwischen Merkmalsausprägungen bestimmt werden. Beispiele dafür sind die Zeit, die jemand für eine bestimmte Tätigkeit braucht, das Einkommen eines Haushalts oder die Entfernung zwischen zwei Orten. Jemand mit einem monatlichen Gehalt von 800 Euro verdient tatsächlich nur halb so viel wie jemand mit einem Gehalt von 1600 Euro im Monat. Mit Ratioskalen können alle mathematischen Operationen durchgeführt werden.
Stetige und diskrete Variablen
Schließlich soll noch die Unterteilung in stetige und diskrete Variablen erwähnt werden: Variablen mit ganzzahligen Ausprägungen (wie z.B. die Semesterzahl) werden als diskret, Variablen mit beliebig feinen Abstufungen (wie z.B. die genaue Angabe von Längen) werden als stetig bezeichnet.
Tab. 3.1: Zusammenfassung: Eindeutigkeit von Skalentypen
Nach: SCHNELL et al. 2005, S 134.
Die Anordnung in der Übersicht (Tabelle 3.1) weist darauf hin, dass eine Rangfolge zwischen den Skalen bezüglich ihres Messniveaus besteht. Je höher das Messniveau einer Skala, umso informativer ist die Messung. Dies kann an einem einfachen Beispiel verdeutlicht werden: Personen können auf Ordinalskalenniveau in klein (1), normal groß (2) und sehr groß (3) unterschieden werden. Daraus geht jedoch nicht hervor, um wie viel größer eine „sehr große“ gegenüber einer „normal großen“ Person ist. Weitaus detailliertere Informationen bietet demgegenüber eine Erfassung auf Ratioskalenniveau in Zentimeter. Darüber hinaus können auch Zusammenhänge mit anderen Merkmalen, wie z.B. dem Gewicht, viel genauer beobachtet werden. Daher sollten Merkmale immer auf einem möglichst hohen Messniveau gemessen werden.
Tab. 3.2: Skalenniveau und Statistische Verfahren
Messniveau und Exaktheit
Neben dem Informationsgehalt steigt mit dem Messniveau auch die Exaktheit der mathematischen Verfahren, die auf die gewonnenen Daten angewendet werden können. Dies führt zu der Frage, welche Verfahren für welches Skalenniveau zulässig sind. Die Tabelle 3.2 bietet eine entsprechende Übersicht (vgl. auch BORTZ 2005). Die jeweiligen Verfahren sind dahingehend unterteilt, ob Unterschiede (z.B.: unterscheiden sich Hauptschüler von Realschülern hinsichtlich ihrer Leseleistungen?) oder Zusammenhänge (z.B.: sind mit einem stärkeren Interesse an mathematischen Fragestellungen auch bessere Fachleistungen in Mathematik verbunden?) überprüft werden sollen (vgl. auch Kapitel 12).
Die in Tabelle 3.2 angegebenen Verfahren werden überwiegend in diesem Lehrbuch behandelt. Sie stellen lediglich eine Auswahl dar. So beziehen sich die unter „Testung von Zusammenhangshypothesen“ genannten Verfahren nur auf Fragestellungen, für die jeweils der Zusammenhang zweier nominalskalierter oder zweier ordinalskalierter Merkmale überprüft werden soll. Denkbar sind jedoch auch andere Kombinationen, so z.B. die Frage, ob größere Menschen (intervallskaliert) auch bessere Zensuren (ordinalskaliert) bekommen. Für weitere Verfahren sei an dieser Stelle auf das Statistiklehrbuch von Bortz (2005) verwiesen.
Messungen in der Erziehungswissenschaft weisen überwiegend Nominal- oder Ordinalskalenniveau auf. Darüber hinaus handelt es sich meistens um Messungen von Konstrukten oder latenten Variablen, die nicht direkt erfassbar sind, sondern über Merkmale (Indikatoren) zugänglich gemacht werden müssen, von denen angenommen wird, dass sie in einem engen Zusammenhang zu dem zu erfassenden Begriff stehen. So steht beispielsweise häufig das Alter eines Lehrers für seine Berufserfahrung; die Variable „Alter“ stellt jedoch nur eine Annährung an das Konstrukt „Erfahrung“ dar. Damit unterscheiden sich Messungen in den Sozialwissenschaften von jenen in den Naturwissenschaften, die sich der Güte ihrer Messinstrumente sicherer sein können.