Читать книгу Methoden in der Politikwissenschaft - Rolf Frankenberger - Страница 18
2.2.6 Operationalisierung und Messung
ОглавлениеUnter Operationalisierung versteht man die Übersetzung von Begriffen in messbare Größen: »Unter der Operationalisierung eines Begriffs ist die Angabe derjenigen Vorgehensweisen, derjenigen Forschungsoperationen zu verstehen, mit deren Hilfe entscheidbar wird, ob und in welchem Ausmaß der mit dem Begriff bezeichnete Sachverhalt in der Realität vorliegt« (Kromrey 2009, 173).
Wie schon mehrfach angesprochen, sind manche Begriffe direkt messbar. Sie haben einen unmittelbaren empirischen Bezug. Andere Begriffe hingegen sind nicht direkt messbar, da sie keinen empirischen Bezug haben. Es müssen also Variablen, sogenannte Indikatoren, gefunden werden, die es ermöglichen, diese Begriffe indirekt zu messen. Ein Konzept wie Produktivität hat zwar einen empirischen Bezug, denn es gibt Unterschiede im Grad der ökonomischen Entwicklung zwischen verschiedenen Ländern. Allerdings können wir diese nicht direkt messen, sondern müssen stellvertretend bestimmte Variablen messen, die mit dem Begriff Produktivität etwas zu tun haben und diesen idealerweise in seiner Gänze abbilden. Wir benötigen Indikatoren als »solche empirischen Sachverhalte, die 1. direkt wahrnehmbar oder feststellbar sind und die 2. eindeutige Hinweise auf den nicht direkt erfahrbaren Sachverhalt liefern« (Kromrey 2009, 167).
Produktivität könnte dabei auf verschiedenen Ebenen gemessen werden. Auf der Ebene einer Volkswirtschaft könnte das Verhältnis zwischen den erzeugten Produkten und den dabei eingesetzten Mitteln (Arbeit, Boden und Kapital) gemessen werden. Notwendig dafür wäre eine getrennte Erfassung aller vier Elemente. Konkret müssten eingesetzte Arbeitszeit, eingesetztes Kapital und eingesetzte Vorprodukte und Rohstoffe sowie die damit erzeugten Produkte einer Volkswirtschaft erfasst und deren jeweilige Geldäquivalente gemessen und in Bezug gesetzt werden.
Wenn bestimmte Begriffe nicht direkt über sogenannte definitorische Indikatoren gemessen werden können, dann benötigt man korrelative oder schlussfolgernde Indikatoren (vgl. Kromrey 2009, 163). Korrelative Indikatoren haben nicht dieselbe Intension oder Bedeutung wie die zu messenden Begriffe, sind diesen aber ähnlich und haben einen direkten empirischen Bezug. Intern korrelative Indikatoren erfassen Teilaspekte eines mehrdimensionalen Phänomens und treten mit anderen Komponenten des definierten Begriffs gemeinsam auf. Wahlen sind zum Beispiel messbare Indikatoren für die Existenz von Demokratie, bilden aber nur einen Teil der Intension von Demokratie ab. Extern korrelative Indikatoren sind nicht Bestandteil der Definition eines Begriffs, korrelieren aber mit der Merkmalsdefinition. Korruption korreliert zum Beispiel negativ mit Demokratie. Kann man also die Existenz von Korruption in nennenswertem Umfang nachweisen, dann kann man davon auf die Nicht-Existenz von Demokratie rückschließen. Schlussfolgernde Indikatoren erlauben Rückschlüsse auf Merkmalsausprägungen, die überhaupt nicht direkt messbar sind. So kann auf den Charakter einer Person lediglich anhand von manifesten Eigenschaften oder Verhaltensweisen rückgeschlossen werden. Dazu wiederum müssen Regeln formuliert werden, wie und warum diese manifesten Variablen überhaupt mit der zu untersuchenden latenten Variable zusammenhängen. Diese Korrespondenzregeln können wiederum falsch sein. Ein Kernproblem der Operationalisierung ist daher deren Validität oder Gültigkeit ( Kap. 5.1.1).
Während definitorische Indikatoren die Intension des Begriffs ganz abdecken, erfassen intern korrelative Indikatoren nur einen Teil der Intension und die Gültigkeit der Operationalisierung hängt dann von der Stärke der Korrelation des Indikators mit den anderen Elementen der Definition ab. Bei extern korrelativen Indikatoren ist die Gültigkeit ungewiss, da es zwar einen Zusammenhang zwischen Indikator und gemeintem Sachverhalt gibt, der Indikator aber kein Bestandteil der zu messenden Sache ist. Die Korrelation wäre also theoretisch zu begründen, um die Gültigkeit der Operationalisierung plausibel zu machen. Im Fall der Korruption würde man argumentieren, dass sie ein Beleg dafür ist, dass Gesetze und Regeln nicht befolgt werden und damit keine Rechtsstaatlichkeit gegeben ist, die wiederum Bestandteil gängiger Definitionen liberaler Demokratien ist. Bei schlussfolgernden Indikatoren ist das Problem der Gültigkeit noch größer, da der Zusammenhang zwischen Indikator und dem Phänomen nicht empirisch, sondern nur theoretisch überprüfbar ist, etwa indem man mögliche Verhaltensmuster hypothetisch formuliert, die mit einem bestimmten Charakter einhergehen, und diese dann wieder überprüft. Narzisst:innen würden sich nicht nur selbst großartig finden, sondern alle anderen abwerten, die sie als Kritiker:innen oder Konkurrent:innen empfinden.
Die Übersetzung von Begriffen in Handlungsanweisungen zur empirischen Anwendung ist eine komplexe Aufgabe. Und sie erfordert sprachliche wie theoretische Sorgfalt. Zunächst müssen Begriffe wissenschaftlich exakt definiert werden, dann Indikatoren ausgewählt und anhand von Korrespondenzregeln mit den Begriffen verbunden werden. Zur empirischen Erfassung der Indikatoren müssen wiederum Messvorschriften formuliert und begründet werden.
Sind Begriffe durch die Operationalisierung einmal messbar gemacht, so erfolgt die eigentliche Messung. Dabei werden Objekten oder Ereignissen »entsprechend den Ausprägungen der an diesen Objekten betrachteten Merkmale« Ziffern nach zuvor formulierten Regeln zugewiesen (Kromrey 2009, 202, vgl. Stevens 1951, 1). Die Messregeln geben dabei an, auf welche Weise Forscher:innen ihre gedanklichen Konzepte mit der Wirklichkeit verknüpfen wollen. Je standardisierter die Forschung, desto präziser müssen die Messvorschriften sein und desto eher sind die Ergebnisse von Messungen Zahlen. So könnte beispielsweise der Begriff Demokratiezufriedenheit über einen Fragebogen gemessen werden. Die Frage könnte lauten: »Wie zufrieden sind Sie im Allgemeinen mit der Demokratie in Deutschland?« Die Antwortmöglichkeiten wären etwa »sehr«, »eher«, »eher nicht« und »gar nicht zufrieden«. Die Frage und die Antwortmöglichkeiten stellen die Operationalisierung dar. Wenn die Frage einer Person gestellt wird, dann würde man den Antwortmöglichkeiten die Ziffern 1, 2, 3 und 4 zuordnen und entsprechend der gewählten Antwort die Ziffer notieren. Das wäre die Messung.
Entscheidend ist bei der Messung, dass diese strukturtreu erfolgt. Die Unterschiede zwischen klassifikatorischen, komparativen und metrischen Begriffen ( Kap. 2.2.1) müssen bei der Operationalisierung und Messung berücksichtigt werden. Die durch den Begriff bezeichnete und strukturierte Objektmenge muss so in einer Menge von Zahlen abgebildet sein, dass die Struktur der empirischen Objekte in der Menge der zugeordneten Zahlen bei aller Vereinfachung erhalten bleibt.
Für klassifikatorische Eigenschaften heißt strukturtreue Abbildung, dass die zugeordneten Zahlen lediglich Gleichheit und Ungleichheit repräsentieren. Daher kann man zur Abbildung dichotomer Ausprägungen zum Beispiel die Ziffern 1 und 2, genauso aber etwa die Zahlen 100 und 372 verwenden. In der Statistik nennt man die daraus resultierende Skala Nominalskala. Gleiche Merkmalsausprägungen erhalten dieselbe Ziffer, unterschiedliche Merkmalsausprägungen unterschiedliche Ziffern. Eine Deutung der Relationen zwischen den Zahlen ist nicht zulässig. Ordnet man Demokratie den Wert 2 zu und Diktatur den Wert 1, so ist Demokratie nicht doppelt so demokratisch, sondern einfach anders.
Für komparative Eigenschaften bedeutet strukturtreue Abbildung, dass sie (Un-)Gleichheit sowie eine Rangordnung der Objekte repräsentieren. Dies kann durch die Ziffern 1, 2 und 3, aber genauso gut durch die Zahlen 9, 17 und 42 erreicht werden, denn bei komparativen Eigenschaften sind die Abstände zwischen den Zahlen nicht von Bedeutung. Die daraus resultierende Ordinalskala ist auch hinsichtlich der Relationen der Ausprägungen interpretierbar. Wird der Grad der Freiheit einzelner Länder – wie etwa beim Freedom House Index3 – anhand von politischen Rechten und bürgerlichen Freiheiten gemessen, dann werden den Merkmalsausprägungen »frei«, »teilweise frei« und »nicht frei« die Ziffern 1, 2 und 3 zugeordnet. Da es sich um einen komparativen Index handelt, gilt, dass Länder mit der Ziffer 1 freier als solche mit der Ziffer 2 und diese wiederum freier als solche mit der Ziffer 3 sind. Die Werte können jedoch nicht hinsichtlich ihrer Abstände interpretiert werden: 1 ist weder um 1 freier noch halb so unfrei wie 2.
Bei metrischen Eigenschaften müssen (Un-)Gleichheit, Rangordnung und Abstände repräsentiert werden. Daher müssen die Abstände zwischen den gemessenen Eigenschaften auch abgebildet werden. Metrische Eigenschaften können entweder in Intervallskalen oder in Ratioskalen übersetzt werden. Bei Intervallskalen können zusätzlich zu Gleichheit und Rangordnung die Abstände zwischen den Zahlen interpretiert werden. Misst man Temperatur in Bezug auf die festgelegten Fixpunkte Gefrier- und Siedepunkt von Wasser und teilt die Skala in gleiche Schritte ein, so kann man sagen, dass 10 °C um 5 ° wärmer sind als 5 °C. Man kann jedoch nicht sagen, dass 10 °C doppelt so warm sind wie 5 °C. Dazu würde man eine sogenannte Ratioskala benötigen, bei der der Nullpunkt auch in Bezug auf das gemessene Phänomen empirisch die Bedeutung eines Nullpunktes hat. Dies ermöglicht die Interpretation der Verhältnisse zwischen Merkmalsausprägungen. 0 € bedeuten für das Merkmal Einkommen, dass kein Einkommen erzielt wird. Ein Einkommen von 50 € ist doppelt so hoch wie eines von 25 €. Beim Beispiel Temperatur wäre die Kelvinskala eine solche Ratioskala, bei der der Nullpunkt bedeutet, dass das Konstrukt Temperatur aufhört zu existieren.
Insgesamt gilt es also festzuhalten, dass es beim Messen als Zuordnung von Zahlen zu Merkmalen und deren Ausprägungen entscheidend ist, festzulegen, welche Unterschiede berücksichtigt werden sollen, welche Maßeinheit verwendet werden soll und nach welchen Regeln Zahlen zu Merkmalsausprägungen zugeordnet werden. Beachtet man das Skalenniveau von Ziffern etwa in Statistiken nicht genau, so wird man schnell unzulässige Aussagen treffen. Wird die Variable Geschlecht mit den Ausprägungen männlich = 1, weiblich = 2 und divers = 3 gemessen, ist die Aussage, dass Geschlecht bei einer Person mit dem Wert 3 dreimal so ausgeprägt ist wie bei einer Person mit dem Wert 1 – auch wenn sie rein auf die Zahlen bezogen stimmen mag – empirischer Unfug.