Читать книгу Deutsche Sprachgeschichte - Stefan Hartmann - Страница 12
2.2.3 Reflexe des Sprachwandels im Gegenwartsdeutschen: Fragebogenstudien und Experimente
ОглавлениеDie historische Linguistik ist auf Korpusuntersuchungen sowie auf die komparative Methode angewiesen, weil sich Sprecherinnen des Frühneuhochdeutschen oder gar des Germanischen oder Indoeuropäischen nicht mehr befragen lassen. Auch für die Gegenwartssprache gibt es gute Argumente, einen beobachtenden Zugang zu wählen, anstatt Sprecherinnen und Sprecher direkt nach ihrem Sprachverhalten zu befragen (oder gar das eigene Sprachverhalten als ausschlaggebend zu betrachten). In einem Diskussionspapier von Arppe et al. (2010) spricht sich beispielsweise Martin Hilpert dagegen aus, Grammatikalitäts- bzw. Akzeptabilitätsurteile zu erfragen – unter anderem deshalb, weil metasprachliche Einschätzungen nicht zwangsläufig das tatsächliche sprachliches Wissen repräsentieren müssen, zu dem wir als Sprecherinnen und Sprecher (und natürlich auch als Sprachwissenschaftler) keinen unmittelbaren Zugang haben. Man könnte noch hinzufügen, dass unterschiedliche Sprecher womöglich unterschiedliche Maßstäbe anlegen. Wenn ich verschiedene Personen befrage, wie akzeptabel für sie eine Form wie dem Vater sein Auto in der Alltagssprache ist, so werden womöglich einige, die diese Form selbst gebrauchen, sie als inakzeptabel kategorisieren, da sie wissen, dass sie als umgangssprachlich bzw. dialektal stigmatisiert ist. Dagegen führt jedoch Antti Arppe im gleichen Diskussionspapier das Argument ins Feld, dass das Fällen (meta)sprachlicher Grammatikalitäts- und Akzeptabilitätsurteile genauso eine sprachliche Aktivität sei wie Sprachproduktion und -rezeption. Auch das kennen wir aus unserer Alltagserfahrung: Wenn jemand tiefstes Sächsisch oder Schwäbisch spricht, bringen wir diese Person schnell mit der jeweiligen Region in Verbindung – und auch mit all den Stereotypen, die wir über Sachsen oder Schwaben haben. Und wenn jemand eine aus unserer Sicht „falsche“ grammatische Form gebraucht, können wir oft gar nicht anders, als den Fehler in Gedanken zu korrigieren. Folgerichtig gilt es bei Studien, die auf Grammatikalitäts- und Akzeptabilitätsurteilen fußen, zwar immer eine Reihe von möglichen Störfaktoren zu bedenken, doch können sie sich für viele Fragestellungen als äußerst aufschlussreich erweisen.
Wie aber – um auf die eingangs gestellte Frage zurückzukommen – können Fragebogenstudien und Experimente zur sprachgeschichtlichen Forschung beitragen? Hier müssen wir uns vor Augen führen, dass Sprachwandel (zumindest in aller Regel) kein sprunghafter, sondern ein kontinuierlicher Prozess ist. Daher hängen Sprachwandel und sprachliche Variation untrennbar zusammen. Einerseits bildet sprachliche Variation die Keimzelle des Sprachwandels, andererseits führt Sprachwandel seinerseits zu Variation. Wenn eine Sprecherin eine neue Form benutzt (Innovation), die sich dann allmählich in der Sprachgemeinschaft ausbreitet (Diffusion), so entsteht dadurch Variation, wobei zunächst alte und neue Form miteinander konkurrieren. Ein einfaches Beispiel: Noch bis ins 19. Jh. war die Form in Ansehung deutlich verbreiteter als ihr heutiges Äquivalent in Anbetracht. Eine einfache Suche im Google ngram Viewer1 – der zwar als Korpus problematisch ist, aber durch die Nutzung der umfangreichen GoogleBooks-Daten eine ungeheuer große Datenbasis hat – zeigt, wie die neue Form um die Wende vom 19. zum 20. Jahrhundert die alte überholt (s. Fig. 10). Die Phase, in der eine neue Form sich durchsetzt und dabei ggf. eine alte verdrängt, nennt man Approbationsphase (vgl. Bechmann 2016: 74). Weil der Prozess graduell ist, existieren eine Zeitlang mehrere Formen nebeneinander. Bechmann (2016: 158) bringt es auf den Punkt: „Gegenwärtiges ist immer Gewordenes aus Gewesenem.“
Dabei kann es zu Zweifelsfällen kommen, bei denen Sprecherinnen und Sprecher unsicher sind, welche von (mindestens) zwei möglichen Formen die standardsprachlich „richtige“ ist (vgl. Klein 2003, 2009). So schwanken Sprecher heute beispielsweise zwischen Pluralformen mit und ohne Umlaut: die Wagen vs. die Wägen. Möglicherweise fiel Sprecherinnen vor etwas über 100 Jahren auch die Wahl zwischen in Ansehung und in Anbetracht nicht leicht. Nübling (2012: 66) vergleicht solche Zweifelsfälle mit „Beben“, die auf tiefgreifende Veränderungen zurückgehen. Fragebogenstudien können somit gleichsam als „Seismograph“ für solche Veränderungen gesehen werden und können helfen, Fragen zu beantworten wie:
Welche alternativen Formen gibt es?
Wird eine der Formen häufiger gebraucht?
Wird eine der Formen in bestimmten Kontexten häufiger gebraucht? (z.B. Registervariation: eine Form findet sich eher in formellen Kontexten, eine andere eher in mündlich bzw. umgangssprachlich geprägten)
Wird eine der Formen in bestimmten Regionen oder Dialektgebieten häufiger gebraucht?
Fig. 10: Frequenz von in Ansehung vs. in Anbetracht im Google Ngram Viewer. (Anteil der jeweiligen Form an allen Tokens im GoogleBooks-Korpus.)
Dieser letztgenannten diatopischen Variation widmen sich beispielsweise Sprachatlanten. Pionierarbeit auf diesem Gebiet hat Georg Wenker (1852–1911) mit seinem „Sprachatlas des Deutschen Reichs“ geleistet, der über das Marburger Forschungszentrum Deutscher Sprachatlas unter www.regionalsprache.de vollständig online abrufbar ist. Mit Hilfe einer Reihe von Sätzen, die er von Volksschullehrern aus dem gesamten damaligen Deutschen Reich ausfüllen ließ, konnte Wenker vor allem die Verteilung lautlicher Varianten kartieren. Aber auch lexikalische Variation zeigt sich in seinen Karten, etwa zwischen Dienstag, Aftermontag (im Ostschwäbischen) und Ertag (im Bairischen) oder zwischen Buddel im Niederdeutschen und Mecklenburgisch-Vorpommerschen einerseits und Flasch(e) in anderen Gebieten.
Im weiteren Verlauf dieses Kapitels werfen wir zunächst einen näheren Blick auf die Methodik von Fragebogenstudien, ehe wir einen Schritt weitergehen und das Potential behavioraler Experimente, die über reine Befragungen hinausgehen, für linguistische Fragestellungen und insbesondere für die Zweifelsfallforschung erkunden.
Fragebogenstudien
Während der Beginn der modernen Umfragenforschung, der naturgemäß insbesondere in Disziplinen wie der Soziologie ein zentraler Stellenwert zukommt, laut Hippler & Schwarz (1996: 726) in die 30er-Jahre des 20. Jh. zu datieren ist, haben wir am Beispiel von Georg Wenkers Deutschem Sprachatlas bereits gesehen, dass die systematische Sammlung von Daten durch Befragung von Informanten bereits im 19. Jh. zum Methodenrepertoire der Sprachwissenschaft gehörte. Seither haben sich die Möglichkeiten der Befragung schon allein durch den technischen Fortschritt tiefgreifend verändert. Dadurch sind natürlich auch die methodischen Anforderungen, die heute an Fragebogenstudien gestellt werden, deutlich rigoroser als noch zu Beginn der Umfragenforschung oder gar zu Wenkers Zeiten. Daher wäre es verfehlt anzunehmen, dass man einen Fragebogen „samstagnachmittags beim Kaffeetrinken“ erstellen könne, wie Porst (2014: 13) die ironische Bemerkung eines Kollegen zitiert.
Porst (1996: 738) definiert einen Fragebogen als
eine mehr oder weniger standardisierte Zusammenstellung von Fragen, welche Personen zur Beantwortung vorgelegt werden mit dem Ziel, deren Antworten zur Überprüfung der den Fragen zugrunde liegenden theoretischen Konzepte und Zusammenhänge zu verwenden.
Es lohnt sich, auf die einzelnen Elemente dieser Definition genauer einzugehen. Fangen wir hinten an, mit dem Ziel des Fragebogens, nämlich der „Überprüfung der den Fragen zugrunde liegenden theoretischen Konzepte und Zusammenhänge“. Wie wir bereits in den vorangegangenen Kapiteln gesehen haben, ist Empirie nie Selbstzweck. Empirische Daten helfen uns, Phänomene zu verstehen, die sich der unmittelbaren Beobachtung entziehen. Die Phänomene, mit denen wir uns in diesem Buch auseinandersetzen, lassen sich unter dem Überbegriff komplexe Systeme zusammenfassen – Sprache, Kognition, Kultur. Sprache ist in Form von Artefakten, also bspw. sprachlichen Lauten, Gebärden und Schriftzeichen, beobachtbar, doch wie Sprache tatsächlich funktioniert, wie und warum sie sich wandelt und ob es Regeln und Prinzipien gibt, denen sprachliche Variation folgt, können wir daraus nicht direkt ersehen. Auch scheinbar Triviales wie die Existenz von Dialekten oder Dialektgrenzen sind keine „harten Fakten“, sondern Kategorisierungsleisungen unsererseits.
Ein Beispiel: Wenn ich als Pfälzer nach Hamburg komme und mir dort auffällt, dass die Leute in der U-Bahn seltsame Wörter benutzen (moin, nech), andere Wörter merkwürdig aussprechen (wat, dat, Hamburch), dann ist das zunächst eine Einzelbeobachtung. Je öfter ich jedoch den gleichen Phänomenen begegne, desto sicherer kann ich mir sein, dass die Abweichungen von meiner eigenen Sprachvarietät systematischer Natur sind und dass es sich um für diesen Sprachraum charakteristische Phänomene handelt. Zunächst aber ist die Idee, dass es eine für diese Region spezifische Sprachvarietät gibt, eine reine Hypothese. Empirische Daten, die beispielsweise durch Fragebogenstudien à la Wenker erhoben werden können, können nun dazu beitragen, meine Kategorisierung zum einen zu überprüfen zum anderen zu verfeinern. Selbst die scheinbar rein deskriptive, also beschreibende, Erhebung von Dialektdaten dient also letztlich der Überprüfung theoretischer Konzepte und Zusammenhänge. Erst recht gilt das für Studien, die einen explanativen, also erklärenden, Anspruch erheben – also beispielsweise der Frage nachgehen, warum eine bestimmte Form gegenüber einer anderen, prinzipiell möglichen Form bevorzugt wird. So wäre eine FragebogenstudieFragebogenstudie vorstellbar, die Grammatikalitätsurteile zu Wörtern mit und ohne Fugen-s erfragt (Erbschaftsteuer vs. Erbschaftssteuer; Seminararbeit vs. Seminarsarbeit; Hauptseminararbeit vs. Hauptseminarsarbeit). Aufgrund der Antworten könnte dann erörtert werden, welche Faktoren dazu führen, dass eher die verfugte als die unverfugte Variante gewählt wird oder umgekehrt (z.B. Anzahl der Kompositionsglieder, phonologische Qualität des Erstglieds usw.).
Betrachten wir nun den ersten Bestandteil der Definition näher, „eine mehr oder weniger standardisierte Zusammenstellung von Fragen“. Damit wird unter anderem der Tatsache Rechnung getragen, dass es bei Befragungen – ähnlich wie in der Korpuslinguistik (s.o. 2.2.2) – sowohl qualitative als auch quantitative Ansätze gibt. Ein offenes Interview – etwa zu den Spracheinstellungen der Befragten (z.B. ob sie einen Dialekt als schön oder weniger schön empfinden) – ist naturgemäß weniger standardisiert als beispielsweise eine Umfrage mit vorgegebenen Antwortmöglichkeiten. Hippler & Schwarz (1996: 727f.) unterteilen qualitative Befragungen in wenig strukturierte und teilstrukturierte Interviews, während sie stark strukturierte Befragungen als quantitative Interviews kategorisieren. Bei der wenig strukturierten Befragung verfügt der Interviewer „über einen hohen Freiheitsspielraum in der Formulierung und Abfolge der Fragen“, während er sich beim teilstrukturierten Interview an vorbereitete und vorformulierte Fragen hält, deren Reihenfolge jedoch variieren kann. Bei quantitativen Befragungen indes stehen sowohl die Fragen als auch die Antwortmöglichkeiten fest, und eine über die Vorgaben des Fragebogens hinausgehende Interaktion zwischen Interviewer und befragten Personen sollte nicht stattfinden. Damit soll auch verhindert werden, dass der Interviewer das Antwortverhalten der Befragten unbewusst steuert. Wenn ich mich beispielsweise als Interviewerin mit dem Teilnehmer vor Beginn der Studie ausgiebig über unsere jeweiligen Einstellungen zu AnglizismenAnglizismen unterhalte, werden seine Antworten in einem Fragebogen über dieses Thema womöglich anders ausfallen, als wenn dieses Gespräch nicht stattgefunden hätte.
Doch auch wenn die Interaktion zwischen Interviewer und Interviewten auf ein Mindestmaß reduziert wird, besteht die Gefahr, dass die Befragten unbewusst und ungewollt manipuliert werden. Zu den Herausforderungen bei der Erstellung eines Fragebogens gehört unter anderem, dass wir mit Sprache arbeiten und Sprache nie ganz neutral sein kann. Ein Fragebogen will also so formuliert sein, dass wir die Probandinnen nicht unbewusst in eine bestimmte Richtung manipulieren. Bradburn et al. (2004: 6f.) zeigen dies eindrücklich am Beispiel des US-amerikanischen General Social Survey, in dem die Antwort darauf, ob die Regierung zu wenig, zu viel oder genau den richtigen Betrag für einen bestimmten Haushaltsposten ausgebe, sehr unterschiedlich ausfielen abhängig davon, ob der Begriff welfare oder assistance to the poor gewählt wurde. Die Frage, wie genau Fragen formuliert werden sollten, ist folgerichtig für die Erstellung eines Fragebogens hochrelevant und wurde und wird in der Sozialforschung viel diskutiert und erforscht (vgl. z.B. Groves et al. 2004, Kap. 7 und passim).
Fig. 11: Fragetypen nach Schlobinski (1996: 39).
Mit den unterschiedlichen qualitativen und quantitativen Methoden bei der Befragung gehen auch unterschiedliche Fragetypen einher (s. Fig. 11). Für qualitative Befragungen sind offene Fragen charakteristisch – also beispielsweise: „Was assoziieren Sie mit dem sächsischen Dialekt?“ Im Bereich der geschlossenen Fragen, die in teilstrukturierten und strukturierten Befragungen eingesetzt werden, kann man mit Schlobinski (1996) grob unterscheiden nach Alternativfragen (z.B. Sollten Deutschlehrer im Unterricht Bairisch sprechen dürfen? – Ja/Nein), direkten Fragen (z.B. Geben Sie bitte alle Dialektausdrücke für ‚Brötchen‘ an, die Sie kennen), indirekten Fragen (z.B. Viele Berliner sind der Meinung, das Bairische sei ein provinzieller Dialekt. Sind Sie auch dieser Meinung?) und Schätzfragen (z.B. Wie viel Prozent der Bayern sprechen Ihrer Einschätzung nach Hochdeutsch?).2 Weiterhin unterscheidet Schlobinski (1996: 39) in Anlehnung an Holm (1986: 32) sechs Fragetypen nach ihrem jeweiligen Gegenstandsbereich (Tab. 6).
Fragetyp | Beispiel |
Faktfragen | Besitzen Sie ein bairisches Wörterbuch? |
Wissensfragen | Ist Bairisch ein niederdeutscher Dialekt? |
Einschätzungsfragen | Spricht Ihrer Meinung nach Horst Seehofer mit seinen Kindern Dialekt? |
Bewertungsfragen | Wie beurteilen Sie die Sprache der bayrischen Politiker? |
Einstellungsfragen | Wie gefällt Ihnen der bairische Dialekt? Oder: Sollten Deutschlehrer im Unterricht Bairisch sprechen? |
Handlungsfragen | Sprechen Sie im Biergarten so wie zu Hause? |
Tab. 6: Unterschiedliche Fragetypen nach Schlobinski (1996), dort nach Holm (1986).
Befragungen lassen sich zum einen nach ihrem Typ klassifizieren (qualitativ vs. quantitativ; wenig strukturiert, teilstrukturiert, strukturiert), zum anderen nach dem Befragungsmodus. Hippler & Schwarz (1996: 728) nennen hier die persönlich-mündliche, die telefonische und die schriftliche Befragung. In den vergangenen Jahren immer wichtiger geworden ist die web-basierte Befragung, die als Subtyp der schriftlichen Befragung gesehen werden kann. Über spezialisierte Dienstleister wie soscisurvey.de oder Google Forms lassen sich einfach und schnell Fragebögen erstellen und veröffentlichen. Dabei ist natürlich zu bedenken, dass man unter Umständen die Kontrolle darüber, wer an der Studie teilnimmt, aus der Hand gibt. So lässt sich bei einer Umfrage zum Deutschen etwa nicht kontrollieren, ob alle Teilnehmerinnen und Teilnehmer deutsche Muttersprachler sind. Auch kann nicht wirksam verhindert werden, dass dieselbe Person mehrfach an der Umfrage teilnimmt.3 Diese Bedenken dürften jedoch eher theoretischer Natur sein, solange es sich nicht um eine Umfrage zu einem emotional oder politisch aufgeladenen Thema handelt, bei der Einzelpersonen oder Gruppen Interesse daran haben könnten, das Ergebnis zu beeinflussen. Auch die Gefahr, dass Teilnehmende bei Online-Befragungen abgelenkt sein könnten, fällt bei Experimenten, die volle Konzentration erfordern, stärker ins Gewicht als bei der typischen FragebogenstudieFragebogenstudie. Somit wiegen die Vorteile der web-basierten Befragung – insbesondere die Möglichkeit, zahlreiche Teilnehmerinnen und Teilnehmer aus verschiedensten Regionen zu erreichen – die Nachteile insgesamt mehr als auf.
Praktische Aspekte bei der Gestaltung von Fragebogenstudien
Die folgende Checkliste kann Ihnen bei der Gestaltung einfacher Multiple-Choice-Fragebogenstudien helfen. Idealerweise sollten Sie natürlich zusätzlich Fachliteratur zur Erstellung von Fragebögen insbesondere aus der quantitativen Sozialwissenschaft heranziehen (z.B. Bradburn et al. 2004, Porst 2014), um verbreitete Fehler zu vermeiden.
✓ | Achten Sie darauf, dass die Fragen klar und verständlich formuliert sind. |
✓ | Versetzen Sie sich in die Lage der Teilnehmerinnen und Teilnehmer und denken Sie daran, dass diese Ihre Fragen ohne das spezifische Vorwissen, über das Sie verfügen, verstehen sollten. Nicht jeder Laie weiß beispielsweise, was Termini wie Plusquamperfekt oder Linksversetzung bedeuten. Denken Sie auch daran, dass die Teilnehmer Ihre Fragen zwangsläufig interpretieren (vgl. Groves et al. 2004: 204). Um die Vergleichbarkeit der Antworten zu gewährleisten, versuchen Sie, den Interpretationsspielraum so gering wie möglich zu halten. |
✓ | Stellen Sie dem eigentlichen Fragebogen knappe, aber klare Instruktionen voran. Denken Sie daran, dass die Teilnehmenden eher geneigt sein werden, die Umfrage vor dem eigentlichen Beginn abzubrechen, wenn die Instruktionen allzu lang ausfallen. Daher gilt für die Instruktionen: So kurz wie möglich, so lang wie nötig. |
✓ | Die Reihenfolge der Fragen sollte randomisiert (zufallsgeneriert) sein. Gerade bei Grammatikalitätsurteilen haben viele Studien etwas gezeigt, was man salopp als „Abstumpfungseffekt“ bezeichnen könnte – wenn man viele Sätze bewertet, werden sie immer akzeptabler (vgl. Schütze 2016: 132f.). Doch auch bei Studien, in denen es nicht um Grammatikalitätsurteile geht, können solche Sukzessionseffekte – also Effekte, die sich aus der Reihenfolge der Fragen ergeben – auftreten. Ein bekanntes Problem sind beispielsweise Ermüdungseffekte (vgl. Ben-Nun 2008). Durch die Randomisierung der Fragenreihenfolge erreicht man, dass dieselbe Frage von manchen Teilnehmern sehr früh, von anderen später beantwortet wird. |
Das gilt natürlich nicht, wenn der Aufbau Ihres Fragebogens einer bestimmten inneren Logik oder „Dramaturgie“ (Porst 2014) folgt, etwa wenn die Fragen aufeinander aufbauen oder wenn Sie „heikle“ Fragen stellen möchten, die man eher am Ende des Fragebogens platzieren sollte (vgl. Porst 2014: 147). | |
✓ | Versuchen Sie, Störvariablen soweit wie möglich auszuschalten. Grob gesagt, sind Störvariablen alle Faktoren, die das Ergebnis einer Untersuchung beeinflussen, ohne dass sie für Ihre Fragestellung relevant sind. Angenommen, Sie wollen erfragen, wie akzeptabel jemand weil mit Verbzweitstellung findet (weil das ist halt so statt weil das halt so ist). Wenn Sie als Stimulus nun einen Satz verwenden wie Die Amigos find ich knorke, weil die sind voll cool und sexy und so, dann ist es möglich, dass die Probanden den Satz nicht wegen seiner Syntax ablehnen, sondern wegen der darin enthaltenen umgangssprachlichen Formulierungen oder wegen seiner verstörenden Gesamtaussage. Ganz vermeiden lassen sich solche Inteferenzeffekte zwar nie, aber ein Satz wie Ich mag meinen Nachbarn, weil er ist immer nett zu mir würde hier den Zweck insgesamt besser erfüllen. |
✓ | Am Ende der Umfrage sollten Sie demographische Daten erheben. Auch das trägt dazu bei, Störvariablen zu kontrollieren: Wenn beispielsweise an einer Umfrage zum am-Progressiv (ich bin am lesen) überwiegend Menschen aus dem hauptsächlichen Verbreitungsgebiet dieser Form teilnehmen, dann ist die Aussagekraft dieser Studie eine andere, als wenn Sprecherinnen aus dem gesamten deutschen Sprachraum teilnehmen. Ebenso kann z.B. die Akzeptanz eines noch recht jungen Phänomens davon abhängen, wie alt die Personen sind, die an meiner Studie teilnehmen. Alter und Region (genauer: Ort der sprachlichen Sozialisation) sollte man daher stets erfragen. Häufig wird auch das Geschlecht erfragt, auch wenn hier bei Fragestellungen zur deutschen Gegenwartssprache nur in wenigen Fällen Unterschiede zu erwarten sind. Da es sich hier um recht persönliche Daten handelt, empfiehlt es sich, sie auf freiwilliger Basis zu erheben. |
Experimente
Schlobinski (1996: 31f.) weist darauf hin, dass Experimente im Vergleich zu anderen Methoden nur eine geringe Rolle in der Sprachwissenschaft spielen. Zieht man in Betracht, dass auch eine Korpusuntersuchung durchaus als Experiment gelten kann, also als „[s]ystematische Beobachtung von veränderlichen Merkmalen unter kontrollierten oder künstlich geschaffenen Bedingungen“ (Meindl 2011: 33), so trifft diese Einschätzung mittlerweile nur noch bedingt zu. Auch Experimente im landläufigen Sinne, also behaviorale Studien, bei denen das Verhalten von Probandinnen und Probanden unter systematisch manipulierten Bedingungen untersucht wird, spielen eine immer größere Rolle in der Sprachwissenschaft. Für die Psycholinguistik gehört das Experiment von Anfang an zum unentbehrlichen Handwerkszeug (vgl. Knobloch 2008). Doch auch die historische Linguistik greift immer häufiger zu experimentellen Methoden, sodass sogar der Terminus „Historische Psycholinguistik“ kein Oxymoron mehr ist (vgl. z.B. Bergs & Pentrel 2014). Zwar kann es naturgemäß keine psycholinguistischen Experimente mit, sagen wir, Sprecherinnen und Sprechern des Frühneuhochdeutschen geben, doch kann zwischen historischer Sprachwissenschaft und Psycholinguistik insofern ein fruchtbarer Austausch stattfinden, als sie ähnlichen Fragen nachgehen und sich dabei oft auch auf die gleichen Grundannahmen stützen. Eine wichtige Grundannahme ist das uniformitariane Prinzip, also die Hypothese, dass sich die Funktionsweise der menschlichen Kognition in den letzten Jahrhunderten bzw. Jahrtausenden nicht wesentlich verändert hat.4 Daraus folgt, dass die gleichen Faktoren, die im synchronen Sprachgebrauch eine Rolle spielen, auch die diachrone Entwicklung von Sprache beeinflussen können. Das gilt insbesondere für kognitive Prinzipien, die in vielen Fällen synchrone und diachrone Phänomene gleichermaßen erklären können. So bringt Köpcke (1988) die Wahl von Pluralformen im Deutschen mit der Fähigkeit zur Prototypenabstraktion und Schemabildung in Verbindung: Im Deutschen gibt es bekanntlich verschiedene Möglichkeiten der Pluralkennzeichnung (sog. Pluralallomorphe), z.B. -en in Frauen, -er in Männer, Nullplural in Tunnel etc. Köpcke (1988) geht davon aus, dass Sprecherinnen und Sprecher aus den Pluralformen, denen sie begegnen, prototypisch organisierte Schemata ableiten. Mit „prototypisch organisiert“ ist dabei gemeint, dass es Kernmitglieder gibt, die dem Muster in besonderem Maße entsprechen, aber auch eher randständige Klassenmitglieder. An einem nicht-sprachlichen Beispiel: Wir können die Farbkategorie „rot“ als prototypisch organisiert verstehen. Das Rot, das der Umschlag dieses Buches hat, ist ein sehr prototypisches Rot. Hellrot oder Weinrot hingegen sind keine prototypischen Rottöne, gehören aber trotzdem noch zur Kategorie.
Die prototypisch organisierten Schemata, so Köpckes Theorie, setzen Sprecherinnen und Sprecher ein, um den Plural von Wörtern zu bilden, die sie bisher nur im Singular kennen. Daraus lassen sich falsifizierbare Hypothesen ableiten: Je stärker ein Wort dem für die jeweilige Flexionsklasse angenommenen Prototypen entsprechen, desto eher wird der Plural nach dem entsprechenden Deklinationsmuster gebildet (s.u. Kap. 5.1.1).
Zur Untermauerung seiner Hypothesen stützt sich Köpcke (1988) zum einen auf historische Evidenz, zum anderen auf eine experimentelle Studie. Im experimentellen Teil seiner Untersuchung nutzt er eine Elizitationsstudie, d.h. er „entlockt“ (elizitiert) seinen Teilnehmenden Pluralformen von Nonsenswörtern wie der Knumpe oder das Trilchel. Solche Materialien, auf die Probandinnen und Probanden reagieren sollen, nennt man Stimuli (Singular: Stimulus). Unter anderem konnte Köpcke zeigen, dass Formen, deren Auslaut als Pluralmarker interpretiert werden könnte (z.B. die Bachter: hier könnte -er als Pluralmorphem gesehen werden), eher mit Nullplural versehen werden (also Singular: die Bachter – Plural: die Bachter) als Formen, die einer prototypischen Singularform entsprechen, also einsilbig sind und auf einen Plosiv (/p/, /t/, /k/, /b/, /d/, /g/) auslauten. Dies bringt er mit der Beobachtung in Verbindung, dass historisch einige auf -en auslautenden Singularformen das -n verloren haben, z.B. die küchen > die Küche. Dadurch wird der Unterschied zwischen Singular- und Pluralform eindeutiger.
Ein weiterer Bereich, in dem sich psycholinguistische Evidenz für die Erklärung diachroner Wandelprozesse als aufschlussreich erweisen kann, ist die Graphie. Das Deutsche weist hier eine Besonderheit auf, die es mit keiner anderen Sprache der Welt – außer dem Luxemburgischen – teilt, nämlich die satzinterne GroßschreibungSubstantivgroßschreibung von Substantiven (vgl. z.B. Bredel et al. 2011: 27). Auch hier können psycholinguistische Studien helfen, die Frage nach dem Warum zu klären. So zeigen beispielsweise Gfroerer et al. (1989) mit Hilfe einer Eye-Tracking-Studie, bei der die Augenbewegungen der Teilnehmenden beim Lesen aufgezeichnet und anschließend analysiert werden, dass die Großschreibung offenbar als Dekodierungshilfe dient: Sie ließen niederländische Muttersprachler deutsche und niederländische Texte lesen, die den deutschen Großschreibungsregeln folgten. Dabei zeigte sich, dass die Teilnehmenden auch beim Lesen der niederländischen Texte nicht von der Großschreibung behindert wurden, obwohl die niederländische Orthographie die satzinterne Großschreibung nicht kennt (außer bei EigennamenEigennamen). Im Gegenteil schienen sie von der Hervorhebung der Substantive zu profitieren und lasen die Texte sogar insgesamt schneller. Diese Beobachtungen können helfen zu erklären, warum sich das Deutsche den „Luxus“ der satzinternen Großschreibung leistet – auch wenn sie natürlich nicht erklären können, warum sich die satzinterne GroßschreibungSubstantivgroßschreibung in anderen Schriftsystemen nicht durchsetzen konnte, etwa im Englischen, wo sie eine kurze Blütezeit im 17./18. Jh. erlebte (vgl. Gramley 2012: 147).
Diese wenigen ausgewählten Beispiele zeigen, dass experimentelle Methoden auch in der germanistischen Linguistik und in der Sprachgeschichtsforschung durchaus Verwendung finden. Allerdings genügen nicht alle Studien den recht rigorosen methodischen Anforderungen, die in der Psychologie und in den Kognitionswissenschaften an experimentelle Untersuchungen gestellt werden. Das gilt sowohl für die Formulierung und Operationalisierung von Hypothesen als auch für die Datenanalyse. Einige wichtige Aspekte, auf die beim Design von Experimenten zu achten ist, fasst die Infobox 6 zusammen. Bei der Datenanalyse sind statistische Verfahren anzuwenden, um zu bestimmen, wie wahrscheinlich es ist, dass die beobachteten Ergebnisse durch Zufall zustandegekommen sind.5
Praktische Aspekte bei der Gestaltung von Experimenten
✓ | Formulieren Sie vor Durchführung des Experiments eine klare Hypothese, die Sie überprüfen möchten. Die Hypothese während oder gar nach Durchführung einer Studie zu ändern, gilt als schlechte wissenschaftliche Praxis. Mittlerweile gibt es mit https://cos.io/prereg/ (zuletzt abgerufen am 20.05.2017) sogar eine Internetseite, auf der WissenschaftlerInnen Hypothesen im Voraus registrieren und damit ihre Forschung transparenter machen können. |
✓ | Wie bei Fragebogenstudien gilt es auch bei behavioralen Experimenten, Störvariablen soweit möglich auszuschalten. Das gilt sowohl für die Gestaltung der Stimuli als auch für die Zusammensetzung der Teilnehmenden. |
✓ | Störvariablen im Bereich der Stimuli können z.B. bei verbalen Stimuli deutliche Unterschiede in der Länge oder Komplexität sein. Angenommen, Sie untersuchen die Hypothese, dass hochfrequente Komposita schneller gelesen werden als niedrigfrequente: Wenn Sie im Bereich der hochfrequenten Komposita z.B. Türgriff und Rollstuhl haben, bei den niedrigfrequenten dagegen Grundstücksverkehrsgenehmigungszuständigkeitsübertragungsverordnung und Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz, dann kann die höhere Lesezeit bei den niedrigfrequenten Stimuli auch schlicht auf deren Länge bzw. auf deren Komplexitiät (mehr Kompositionsglieder) zurückgeführt werden. |
✓ | Störvariablen im Bereich der Zusammensetzung der Teilnehmenden können z.B. durch Unausgewogenheiten in den demographischen Daten entstehen. Suboptimal wäre es z.B., wenn an Ihrem Experiment sehr viele junge Personen und zwei 80-Jährige teilnehmen, oder wenn die allermeisten Teilnehmenden einen Hochschulabschluss haben und nur wenige nicht. Natürlich ist es nicht möglich, solche Unausgewogenheiten komplett zu vermeiden. Es kann jedoch hilfreich sein, sich im Voraus zu fragen: Welche Faktoren könnten (außer denen, deren Einfluss ich mit meiner Untersuchung überprüfen will) das Verhalten der Versuchsperson beeinflussen? Wenn ich z.B. ein Lesezeitexperiment mache, muss ich damit rechnen, dass eine Person, die im Alltag wenig liest, langsamer liest als eine Germanistikstudentin. Der einfachste Weg, die demographischen Daten konstant zu halten, ist, nur eine einzige Gruppe (z.B. Studierende) als ProbandInnen zu wählen. Für eine Seminar- oder Abschlussarbeit ist das absolut ausreichend. Für größer angelegte Studien indes wäre mehr Diversität wünschenswert – schließlich wissen wir mittlerweile schon sehr viel aus behavioralen Experimenten über bestimmte Bevölkerungsgruppen (wie Studierende), über andere hingegen sehr wenig (vgl. z.B. Henrich et al. 2010). |
✓ | Viele experimentelle Setups setzen voraus, dass die ProbandInnen nicht genau wissen, worum es in der Studie geht, da wir ja daran interessiert sind, wie sie sich spontan verhalten, nicht, wie sie sich bewusst entscheiden. Deshalb ist es zumeist sinnvoll, Distraktoren einzubauen, also Stimuli, die vom eigentlichen Ziel des Experiments ablenken und nicht in die Auswertung mit eingehen. |
✓ | Genau wie bei Fragebogenstudien, ist auch bei Experimenten damit zu rechnen, dass Probandinnen und Probanden mit der Zeit Ermüdungserscheinungen zeigen und/oder in ihrem Umgang mit den jeweiligen Stimuli ein bestimmtes Muster entwickeln. Daher ist es auch hier wichtig, die Reihenfolge der Stimuli nach Möglichkeit zu randomisieren. |
Zum Weiterlesen
Einführungen in experimentelles Design und Datenanalyse gibt es enorm viele. Für die Linguistik bietet Meindl (2011) einen wertvollen Einstieg. Abdi et al. (2009) ist eine gut lesbare Einführung, die aus dem Bereich der experimentellen Psychologie stammt. Sehr anspruchsvoll ist dagegen Maxwell & Delaney (2004). Eine unterhaltsame, streckenweise etwas zu lang geratene Einführung in die Datenanalyse mit R bieten Field et al. (2012).
Aufgabe
1 Diskutieren Sie das oben zusammengefasste Experiment von Köpcke (1988). Erkennen Sie Störvariablen, die man bei eventuellen Folgestudien beseitigen sollte?
2 Informieren Sie sich über Lesezeitexperimente und überlegen Sie, ob man ein Experiment zur Konkurrenz zwischen unterschiedlichen Pluralallomorphen (wie des Bärs vs. des Bären) auch damit durchführen könnte – und wenn ja, wie.