Читать книгу Bilingualer Erstspracherwerb - Stefan Schneider - Страница 7

Оглавление

3 Fragestellungen, Hypothesen und Methoden

3.1 Fragestellungen

Sprache kann aus vielen Blickwinkeln betrachtet werden. Ein Blickwinkel, der in den letzten Jahrzehnten an Bedeutung gewann, ist die Betrachtung der Sprache als Abbild oder Spiegelbild der psychischen und mentalen Zustände eines Individuums. Diese Sichtweise bewog viele Linguisten und Linguistinnen dazu, von der Sprachstruktur Rückschlüsse auf die kognitiven Strukturen der Sprecher und Sprecherinnen anzustellen und dadurch in die Psychologie und später auch in die Neurologie vorzudringen. Noam Chomsky, der einflussreichste Linguist des zwanzigsten Jahrhunderts, unterstrich in seinen Arbeiten wiederholt, dass die Sprachwissenschaft ein Teilgebiet der Psychologie bzw. der Kognitionsforschung sei (Chomsky 1972, 1; Siebert-Ott 2001, 27). Spätestens ab diesem Zeitpunkt konnte man von den Brückendisziplinen Psycholinguistik und Neurolinguistik sprechen. Das Hauptinteresse der Psycholinguistik galt lange Zeit dem Spracherwerb und der Kindersprache schlechthin. Eine wiederholt aufgeworfene Frage war diejenige nach den universellen Charakteristiken und Eigenschaften der Kindersprache, die auf allen Kindern gemeinsame mentale Strukturen und Entwicklungsprozesse hinweisen könnten. Diese Charakteristiken stehen im Gegensatz zu partikulären Erscheinungen, die auf strukturelle Gegebenheiten der jeweiligen Einzelsprache zurückzuführen sind und keine allgemeine mentale Basis haben. Noam Chomsky ging sogar soweit, von einer Universalgrammatik zu sprechen. Nach dieser Annahme hätten alle Sprachen eine Reihe von gemeinsamen grundlegenden Eigenschaften. Diese wären der direkte Ausdruck eines angeborenen Sprachinstinkts. Das war der Punkt, an dem man sich der wenigen existierenden Studien über bilinguale Kinder entsann und darin Anhaltspunkte für universelle Prozesse und Mechanismen des Spracherwerbs suchte. Die daraufhin einsetzende Welle von Forschungsarbeiten über den bi- und multilingualen Spracherwerb bezweckte, diese Prozesse und Mechanismen zu erschließen, entwickelte jedoch bald eine Eigendynamik, durch die sich ein viel weiteres Feld an Fragestellungen eröffnete. In den folgenden Seiten werde ich diese Fragestellungen kurz vorstellen.

Eine von Eltern wie von Wissenschaftlern oft gestellte Frage ist natürlich, ob es Unterschiede zwischen dem monolingualen und dem bilingualen Spracherwerb gibt. Der Vergleich mit den Sprachkompetenzen einsprachiger Kinder bewegt Eltern, Lehrpersonen und andere Beteiligte in besonderem Maße. Aber auch in der Forschung ist er gegenwärtig. Schon Ronjat (1913) und Leopold (1939–1949) gehen zum Beispiel wiederholt auf die Frage ein, wie ihre Kinder gegenüber gleichaltrigen einsprachigen Kindern im Hinblick auf das Sprachvermögen einzustufen sind. Das hat damit zu tun, dass man damals von der impliziten Annahme ausging, die Bilingualität sei ein gegenüber der monolingualen Norm abweichendes Phänomen, das einer speziellen Rechtfertigung bedürfe. Heutzutage ist der Aspekt des Vergleichs natürlich noch immer präsent, er dient jedoch nicht zur generellen Beurteilung von Bilingualität, sondern als empirische Methode, um im Spracherwerbsprozess die spezifisch bilingualen Phänomene aus den allgemeinen Erscheinungen herausfiltern zu können. Nur wenn man den monolingualen Spracherwerb mit betrachtet, kann man zum Beispiel erkennen, ob bestimmte Äußerungen eines bilingualen Kindes durch Einfluss der anderen Erstsprache entstanden sind oder eine im monolingualen Spracherwerb ganz normale Erscheinung darstellen. Ähnliches gilt für die Frage nach dem Ablauf und den Entwicklungsphasen frühkindlicher Zweisprachigkeit. Diese ist auch in der Forschung zum Erstspracherwerb ein wichtiges Thema.

Das Thema des sprachlichen Inputs und seines Einflusses ist in vielen Studien gegenwärtig. Es geht nicht nur um die Validität der durch Ronjat (1913) bekannt gewordenen Konstellation eine Person → eine Sprache, also des Prinzips der strikten Inputtrennung, sondern beispielsweise auch darum, wie viel Input nötig ist, um eine gelungene Zweisprachigkeit sicher zu stellen. Mit der Quantität und Qualität des Inputs ist die Frage nach der Ausgewogenheit der Kompetenzen in den beiden Sprachen und nach der eventuellen Dominanz einer der beiden Sprachen verbunden. Des Weiteren tritt hier die Problematik zu Tage, wie sich ein plötzlicher Abbruch oder Wechsel des Inputs auf die bilinguale Kompetenz auswirkt.

Trennung oder Nichttrennung des sprachlichen Inputs werden häufig mit der Frage in Beziehung gesetzt, wann, warum und in welcher Form Sprachmischung stattfindet. Die Sprachmischung gehört zur Natur der Bilingualität (Bolonyai 2009, 259). Sie zeichnet erwachsene fließende Sprecher und Sprecherinnen von zwei Sprachen genauso aus wie Kinder, die gerade im Begriff sind, zwei Sprachen zu erwerben. Die Sprachmischung bei bilingualen Erwachsenen wird im Allgemeinen wohlwollend und als Ausdruck ihrer ausgezeichneten Kompetenzen in beiden Sprachen gewertet. Ganz anders sehen Lehrpersonen, besorgte Eltern und Laien die Sprachmischung in der frühkindlichen Zweisprachigkeit. Das vermeintlich unsystematische und gegen alle Regeln verstoßende Mischen der Kinder wird als nachteilige Auswirkung des bilingualen Erstspracherwerbs interpretiert. In der neueren linguistischen Forschung wird Sprachmischung hingegen als nützliche Strategie gesehen, mit deren Hilfe sich bilinguale Kinder und Erwachsene effektiver ausdrücken können (Bolonyai 2009, 253 f.). Die Sprachmischung wird durch die Interaktion mehrerer Faktoren verursacht. Einer davon ist sicherlich die Sprachmischung in der Sprache der Personen, mit welchen die bilingualen Kinder Kontakt haben. Die Frage, ob Sprachmischung im Input die Ursache für Sprachmischung bei bilingualen Kindern sein kann, ist allerdings empirisch kaum zu beantworten, da es keine empirische Studie gibt und auch nie geben wird, in der die sprachliche Umgebung von bilingualen Kindern vollkommen frei von Sprachmischung ist. Wie wir in Abschnitt 2.4 gesehen haben, ist Mischung im elternsprachlichen Input die Regel und unvermeidlich. In vielen Fällen findet sie zudem unbewusst statt. Man kann sich höchstens fragen, ob die Intensität der Sprachmischung im Input mit derjenigen der bilingualen Kinder korreliert.

Die Sprachmischung hängt zudem mit der Frage nach der Beziehung zwischen den beiden sich im Kind entwickelnden Sprachen zusammen. Diese Frage monopolisierte die Forschung ab den 1970er Jahren. Drei Optionen (Müller et al. 2011, 97–119; Patuto 2012, 57; Yip 2013, 123) wurden im Laufe der Jahrzehnte diskutiert: ein einziges, hybrides Sprachsystem in der Anfangsphase des Spracherwerbs; antithetisch dazu zwei vollkommen getrennte Sprachsysteme von Anfang an; sozusagen als Synthese getrennte Sprachsysteme mit beschränkter Interaktion. Während in den 1970er Jahren und Anfang der 1980er Jahre vor allem die erste Option ins Auge gefasst wurde, fand ab Mitte der 1980er Jahre die zweite Option die meisten Befürworter. Man diskutierte über den Zeitpunkt, ab dem bilinguale Kinder zwei getrennte und autonome Sprachsysteme aufbauen. Heute steht in erster Linie die dritte Möglichkeit zur Debatte (Serratrice 2013, 87). Dem ist allerdings hinzuzufügen, dass gebrauchsbasierte und konstruktivistische Spracherwerbstheorien den Begriff des Systems als geeignete Kategorie zur Beschreibung der frühkindlichen Sprache prinzipiell in Frage stellen.

Wenn man vom Input spricht, sollte man die in Abschnitt 2.5 angesprochene artifizielle Bilingualität nicht vergessen, also eine kommunikative Konstellation, in der sich die Eltern – beide oder nur ein Elternteil – konsequent in einer von ihnen sehr gut beherrschten Zweitsprache, also in einer Fremdsprache, an das Kind richten. Sie ist, wie wir gesehen haben, in der heutigen Zeit gar nicht so selten anzutreffen, wie Akinci, De Ruiter und Sanagustin (2004) zeigen. Die Entwicklung des Wortschatzes stellt im monolingualen wie auch im bilingualen Erstspracherwerb ein zentrales Forschungsthema dar. Im bilingualen Erwerb stellt sich zusätzlich die Frage nach den interlingualen Synonymen oder Äquivalenten. Verfügen bilinguale Kinder über Wörter in beiden Sprachen, die jeweils die gleiche Bedeutung haben? Wie und ab wann werden diese erworben? Werden diese Bedeutungen von den Kindern als gleich empfunden oder besteht die Übereinstimmung nur in der Erwachsenensprache? Die Beantwortung dieser Fragen hat Auswirkungen auf die eben angesprochene Diskussion über ein hybrides Sprachsystem, denn die Existenz von Äquivalenten ist zweifelsohne ein Indiz für zwei getrennte Sprachsysteme.

Wenn Sprecher und Sprecherinnen unterschiedlicher Sprachen regelmäßig und für längere Zeit interagieren, spricht man von Sprachkontakt. Die Einsicht, dass sich dieser Kontakt nicht nur innerhalb einer Gesellschaft, sondern im Grunde auch innerhalb eines Individuums abspielen kann, finden wir schon in Weinreich (1953). Hinter jeder Form des gesellschaftlichen Bilingualismus steht ein bestimmtes Maß an individueller Bilingualität. Romaine (1996, 573) unterstreicht daher, dass „[...] the bilingual individual is the ultimate locus of language contact“ ‚[...] das bilinguale Individuum ist der eigentliche Ort des Sprachkontaktes‘. Das Aufeinandertreffen von zwei Sprachen führt immer zu Sprachkontaktphänomenen, beispielsweise zu Sprachmischung.

Bis heute beschäftigt sich die Kontaktlinguistik vornehmlich mit dem Sprachkontakt auf der gesellschaftlichen Ebene. Dessen Rolle bei Sprachwandel und Grammatikalisierung ist gut erforscht. Seine Wichtigkeit ist unumstritten und bedarf keiner besonderen Ausführungen mehr. Dazu gibt es eine Vielzahl historischer und aktueller Beispiele (z. B. Heine und Kuteva 2005). Länger andauernder Sprachkontakt kann zu einer gegenseitigen Beeinflussung von Sprachen und einer Reihe von gemeinsamen Merkmalen führen. Wenn diese strukturellen und lexikalischen Gemeinsamkeiten mehrere genetisch nur entfernt oder gar nicht verwandte Sprachen betreffen, die aber geografisch benachbart sind, spricht man von Sprachbund. Die Entstehung des Balkansprachbundes (Albanisch, Bulgarisch, Mazedonisch und Rumänisch) ist nur durch den Bilingualismus (und die Bilingualität) erklärbar, zu der die ursprüngliche nomadische Lebensform, die periodischen Wanderungen der Hirten und die gemeinsamen Handelsplätze der Balkanvölker führten (Schaller 1975, 109–120). Intensiver Sprachkontakt kann so weitreichende strukturelle Veränderungen beinhalten, dass er zur Bildung eines Pidgin, sprich zu einer Handels-, Verkehrs- oder Mischsprache führt. Wenn diese Sprache an die nächsten Generationen weitergegeben und dadurch deren Erstsprache wird, kann man von der Entstehung einer neuen Sprache sprechen. Diese wird üblicherweise Kreolisch genannt.

Erst in den letzten Jahren stellt man sich verstärkt die Frage, wie der kontaktinduzierte Sprachwandel letztlich durch das sprachliche Verhalten von Individuen hervorgerufen wird und welche Parallelen zwischen dem gesellschaftlichen Sprachkontakt und dem individuellen Sprachkontakt existieren. Inwiefern sind die Erkenntnisse der Kontaktlinguistik auf den individuellen Sprachkontakt und die Bilingualität übertragbar und umgekehrt? Uns interessiert vor allem die Frage, wie diese Erkenntnisse für die Erforschung der frühkindlichen Bilingualität fruchtbar gemacht werden können. Ein Ergebnis dieses Austausches liegt schon vor: Die Beschreibung und Systematisierung der Sprachmischung speist sich aus beiden Richtungen. Yip und Matthews (2007, 227–254) widmen den Parallelen zwischen frühkindlichen und individuellen Sprachkontakterscheinungen auf der einen Seite und gesellschaftlichen Sprachkontakterscheinungen und Sprachwandel auf der anderen Seite ein ganzes Kapitel. Sie stellen im Englischen der von ihnen untersuchten Kinder Phänomene fest, die auf den Einfluss des Kantonesischen zurückzuführen sind. Ähnliche Phänomene kann man in chinesisch-englischen Kontaktsprachen, wie dem Chinese pidgin English oder dem Singapore colloquial English, beobachten.

Bis zu Beginn der 1960er Jahre wurde Zweisprachigkeit in der pädagogischen Literatur sehr negativ bewertet (Leopold 1949a, 187; Adler 1977, 40; McLaughlin 1978, 77 f., 168 f.; Hakuta 1986, 16–33, 59–65; Lebrun und Paradis 1984, 9 f.; Kielhöfer und Jonekeit 1995, 9, 19; Döpke 1997, 95). Vor allem zwei vermeintliche Nachteile der Bilingualität wurden unterstrichen: Zweisprachige Kinder würden erstens öfter stottern als einsprachige und hätten zweitens eine verspätete kognitive Entwicklung, was zu einer verminderten Intelligenz führen könnte. Einige frühe Studien setzten in der Tat Zweisprachigkeit mit Stottern in Verbindung. Pichon und Borel-Maisonny (1937) stellten fest, dass 14 % ihrer stotternden Patienten zweisprachig waren. Zu einem ähnlichen Ergebnis kamen Travis, Johnson und Shover (1937). Die Ansicht, dass Zweisprachigkeit nachteilige Auswirkungen auf die kognitive Entwicklung haben kann, beruht ebenfalls auf frühen Studien aus der Zeit zwischen den beiden Weltkriegen. Ein bekanntes Beispiel für eine solche Studie ist diejenige von Saer (1923). In ihr wurden ein- und zweisprachige Kinder aus Wales mittels Tests bezüglich ihrer Intelligenz untersucht. Die einsprachigen Kinder wiesen einen höheren Intelligenzquotienten auf. In späteren Jahren wurde jedoch klar, dass bei Miteinbeziehung des sozioökonomischen und regionalen Hintergrundes und der Verabreichung nicht-verbaler Tests diese Ergebnisse hinterfragt werden müssen und ihre Schlussfolgerungen nicht haltbar sind.

3.2 Hypothesen

In den letzten Jahrzehnten wurde in der Forschung eine Reihe von Hypothesen und Erklärungsmodellen vorgeschlagen. Einige davon betreffen speziell den bilingualen Erstspracherwerb, andere stammen aus affinen Forschungsbereichen, haben jedoch bedeutende Auswirkung auf den bilingualen Erstspracherwerb.

Eine Hypothese des letzteren Typs ist die critical period hypothesis. Die Hypothese betrifft den Spracherwerb im Allgemeinen und stellt, obwohl selbst nur eine Annahme, eines der Hauptargumente für die Nativismushypothese dar, also für die Annahme, die sprachliche Entwicklung des Menschen wäre in ihren wesentlichen Zügen durch eine angeborene Sprachfähigkeit bestimmt. Die Hypothese hat zwei unterschiedliche Ausformungen (Pallier 2007, 155). Sie kann einerseits ganz allgemein bedeuten, dass die Menschen in den ersten Lebensjahren effizientere Sprachlerner sind. In ihrer zweiten, spezifischeren Form kann sie bedeuten, dass die altersbedingte Abnahme der neuronalen Plastizität für die abnehmende Spracherwerbsfähigkeit verantwortlich ist. Die beiden Ausformungen der Hypothese müssen deshalb unterschieden werden, weil eine kritische Periode in der ersten Ausformung auch dann bestehen kann, wenn ihre Erklärung durch die abnehmende neuronale Plastizität falsch ist.

In der zweiten, spezifischeren Form wurde die Hypothese zuerst von den Neurologen Penfield und Roberts (1959) entwickelt und später durch Lenneberg (1967) in der Linguistik bekannt gemacht. Laut Lenneberg (1967, 150–154, 178–182) sind bis zum Alter von zwei Jahren die Sprachfähigkeiten gleichmäßig auf beide Hirnhälften verteilt und verlagern sich bis zur Pubertät langsam in die linke Hemisphäre. Wenn dieser Prozess der Lateralisierung abgeschlossen ist, ist auch das Zeitfenster geschlossen, in dem ein erfolgreicher Erstspracherwerb möglich ist. Dies betrifft wohlgemerkt lediglich die grammatischen Fähigkeiten, denn der Wortschatz kann auch danach erweitert werden. Die Hypothese beruht auf Untersuchungen über die Auswirkung von Läsionen des Gehirns. Läsionen in der linken Hemisphäre führen bei Erwachsenen zumeist zu einer Sprachstörung (Aphasie). Das Gehirn von Kindern besitzt jedoch eine außerordentliche Plastizität und Flexibilität. Bis zum Alter von zehn Jahren kann sich das Gehirn nach Läsionen der linken Hemisphäre reorganisieren und die Sprachfunktionen in die andere Hemisphäre verlagern. Damit versuchte Lenneberg (1967, 142–150) zu erklären, warum Läsionen des Gehirns bei Kindern nicht die permanente und vollkommene Auswirkung auf die Sprachfähigkeit haben wie bei Erwachsenen. Die Hypothese in dieser spezifischen Ausformung und Formulierung ist zweifelsohne überholt. In den letzten Jahren machte die Hirnforschung beachtliche Fortschritte. Nicht überholt ist jedoch die Hypothese in ihrer allgemeinen Ausformung, d. h. die generelle Annahme einer sensiblen Phase (Szagun 2006, 248–255), während der wir Menschen eine erhöhte Sensibilität für sprachliche Erfahrung besitzen. Im Unterschied zu Lenneberg (1967) wird heutzutage der Altersbereich zwischen vier und sieben Jahren als derjenige gesehen, in dem diese Sensibilität graduell abnimmt (Chilla, Rothweiler und Babur 2013, 50). Außerdem geht man heute davon aus, dass es für die einzelnen sprachlichen Fähigkeiten (phonologische, grammatische, semantische) unterschiedliche optimale Erwerbsperioden gibt. Wahrscheinlich liegt das kritische Zeitfenster für den Erwerb der phonologischen Eigenschaften vor demjenigen für den Erwerb anderer sprachlicher Domänen. Sogar innerhalb der einzelnen Domänen wurden unterschiedliche Zeitfenster festgestellt. Beispielsweise vollzieht sich das perceptual narrowing oder perceptual tuning (Abschnitt 6.2) für Unterschiede in der Tonhöhe zwischen dem sechsten und achten Lebensmonat, während es für Vokale zwischen dem sechsten und elften und für Konsonanten zwischen dem achten und elften Monat eintritt (Liu 2013, 141).

Die threshold hypothesis, auf Deutsch als Schwellenhypothese bekannt, wurde zuerst von Cummins (1976) vorgeschlagen und in Cummins (1977, 1979) zu einem Modell ausgebaut. Obwohl sie heute wahrscheinlich in ihrer ursprünglichen Form nicht mehr haltbar ist, besitzt sie angesichts der intensiven Diskussion über die Möglichkeiten zur Verbesserung der sprachlichen Kompetenzen und schulischen Leistungen von Migrantenkindern noch immer Aktualität. Sie betrifft die Auswirkungen der Zweisprachigkeit auf die kognitive Entwicklung. Gemäß der Hypothese hängt die kognitive Entwicklung bilingualer Kinder von den Kompetenzen in den jeweiligen Sprachen ab. Die Abbildung 1 stellt die Hypothese bezogen auf die Kompetenzen eines einzelnen bilingualen Kindes dar.


Abb. 1: Schwellenhypothese (Cummins 1979, 230)

Es werden zwei Schwellen angenommen, ein „lower threshold level of bilingual competence“ und ein „higher threshold level of bilingual competence“. Unterhalb der unteren Schwelle bewegen sich die Kompetenzen in beiden Sprachen auf einem sehr niedrigen Niveau. Die Zweisprachigkeit, egal ob ausgeglichen oder unausgeglichen, hat negative Auswirkungen auf die kognitive Entwicklung. Sprachkompetenzen, die in einer der beiden Sprachen mit denjenigen von Muttersprachlern vergleichbar sind, werden der dominanten Zweisprachigkeit zugeordnet und sind zwischen der unteren und der oberen Schwelle angesiedelt. Die Zweisprachigkeit hat weder negative noch positive Auswirkungen. Nur im Falle von ausgewogen bilingualen Kindern, deren Kompetenzen in beiden Sprachen ein hohes Niveau erreichen und daher über der oberen Schwelle liegen, sind kognitive Vorteile gegenüber monolingualen Kindern feststellbar. Cummins (1979, 230) betont ausdrücklich, dass die Schwellen nicht absolut definiert werden können:

The threshold cannot be defined in absolute terms; rather it is likely to vary according to the children’s stage of cognitive development and the academic demands of different stages of schooling.

‚Die Schwelle kann nicht absolut definiert werden; sie variiert wahrscheinlich eher gemäß dem Stadium der kognitiven Entwicklung der Kinder und den akademischen Anforderungen der verschiedenen Schulstufen.‘

Der enge Bezug der Schwellenhypothese zu dem in der damaligen skandinavischen Linguistik entwickelten Begriff des Semilingualismus oder doppelten Semilingualismus (Hansegård 1968; Skutnabb-Kangas und Toukomaa 1976; Toukomaa und Skutnabb-Kangas 1977) wird von Cummins (1979) unterstrichen. Sprachliche Kompetenzen, die unterhalb der unteren Schwelle liegen, werden von ihm mit Semilingualismus beschrieben.

Eng mit der Schwellenhypothese verbunden ist die developmental interdependence hypothesis oder Interdependenzhypothese, die in ihren Grundzügen schon in Toukomaa und Skutnabb-Kangas (1977) zu finden ist und in Cummins (1979) genauer erläutert wird. Sie besagt, dass das Kompetenzniveau, das ein Kind in der Zweitsprache erreicht, zum Teil von dem Niveau abhängt, das das Kind in der Erstsprache zu dem Zeitpunkt aufweist, an dem der intensive Kontakt mit der Zweitsprache beginnt. Wenn der Wortschatz und die Strukturen der L1 durch die Sprachgemeinschaft außerhalb der Schule in vielerlei Hinsicht unterstützt werden, erreicht das Kind in der Regel ein hohes Niveau in der L2, ohne negative Auswirkungen auf die L1 und die Kognition im Allgemeinen. Dagegen kann intensiver Kontakt mit einer L2 in den ersten Schuljahren, bevor die L1 ein angemessenes Niveau erreicht, eine erfolgreiche sprachliche und kognitive Entwicklung in Frage stellen. Die Hypothese ist für die sprachliche Erziehung und Bildung von Migrantenkindern von großer Bedeutung. Die Schwellenhypothese kann zusammen mit der Interdependenzhypothese eine Erklärung liefern, warum Kinder einer sprachlichen Minderheit, die nur in der Mehrheitssprache unterrichtet werden, in ihrer Sprachkompetenz häufig Probleme aufweisen und bezüglich der schulischen Leistungen unter der Klassennorm liegen. Deshalb wird als wichtiges Erziehungsprinzip für Migrantenkinder vorgeschlagen, mit der Erziehung in der Zweitsprache erst dann zu beginnen, wenn ihre Erstsprache die entscheidende Schwelle der Sprachkompetenz erreicht hat. Die beiden Hypothesen von Cummins (1976, 1977, 1979) werden oft mit den Begriffen Submersion und Immersion in Verbindung gesetzt. Mit Submersion bezeichnet man eine schulische Situation, in der Kinder, deren erstsprachliche Kompetenzen noch nicht vollständig entwickelt sind, ausschließlich in einer Zweitsprache unterrichtet werden. Sie werden in der L1 sozusagen ‚untergetaucht‘. Im Falle der Immersion hingegen ist die Erstsprache in der Regel die Sprache der Mehrheit und besitzt ein hohes Prestige (z. B. Englisch in der kanadischen Provinz Ontario); der Unterricht findet ausschließlich (totale Immersion) oder teilweise (partielle Immersion) in einer Zweitsprache (Französisch in Ontario) statt.

In den 1980er Jahren erreichte die Debatte für und wider hybrides Sprachsystem am Anfang des Spracherwerbs ihren Höhepunkt. Rein chronologisch gesehen wurde zuerst eine Hypothese zur getrennten Entwicklung formuliert. In der Tat finden wir die erste Formulierung der independent development hypothesis in Bergman (1976, 88, 94). Die Forscherin nimmt an, dass sich die beiden Sprachen im Kind unabhängig voneinander entwickeln und ihr Erwerb den jeweiligen monolingualen Erwerb widerspiegelt. Der einzige Faktor, der eine getrennte und unabhängige Entwicklung gefährden kann, ist der gemischtsprachige Input. De Houwer (1990) stellt zwar Bergmans (1976) Daten infrage, da diese von einem Mädchen stammen, das erst ab dem siebenten Lebensmonat mit der zweiten Sprache (Spanisch) in Kontakt gekommen war, ist aber prinzipiell der gleichen Ansicht. Die von De Houwer (1990, 2005, 2009, 277–287) vertretene separate development hypothesis ist faktisch eine Weiterentwicklung von Bergman (1976), beschränkt sich jedoch auf die morphosyntaktische Entwicklung. Gemäß De Houwers (1990, 2005, 2009, 277–287) Hypothese sind die morphosyntaktischen Strukturen der beiden Sprachen von Anfang an getrennt und entwickeln sich getrennt weiter. Die beiden Sprachen werden als Systeme angesehen, die zum Großteil in sich abgeschlossen sind und nicht interagieren.

Die separate development hypothesis von De Houwer (1990, 2005, 2009, 277–287) kann nur im Zusammenhang mit der bekanntesten Hypothese zum bilingualen Erstspracherwerb, der Ein-System-Hypothese, verstanden werden, weil sie zu dieser in radikaler Antithese steht. Die bekannteste Ausprägung der Ein-System-Hypothese (Bergman (1976, 88) bezeichnet diese Hypothese als „mish-mash hypothesis“) ist in der deutschen Linguistik unter dem Namen Drei-Phasen-Modell bekannt (Müller et al. 2011, 97). Es handelt sich um die von Volterra und Taeschner (1978) vertretene Ansicht, der bilinguale Spracherwerb laufe in drei Phasen ab. Nach einer Anfangsphase, in der die Kinder über ein einziges hybrides Sprachsystem verfügen, tritt in der zweiten Phase die sprachliche Differenzierung auf der lexikalischen Ebene und in der dritten Phase auf der syntaktischen Ebene ein. Einige Jahre lang schien das Modell die Entwicklung der sprachlichen Kompetenz bilingualer Kinder am überzeugendsten wiederzugeben. Leopold (1939–1949, 1978), Burling (1959), Murrell (1966), Swain (1972), Redlinger und Park (1980), Saunders (1982), Vihman (1982, 1985, 1986) und Arnberg und Arnberg (1985) glaubten ebenfalls, in der Sprache der von ihnen untersuchten bilingualen Kinder eine Anfangsphase mit einem einzigen undifferenzierten Sprachsystem feststellen zu können. Doch schon bald erhob sich Kritik und ab Mitte der 1980er Jahre wurden die Zweifel an dem Modell immer lauter. Neuere Daten stellten die Hypothese in mehreren Aspekten in Frage (z. B. Meisel 1986, 1989; Genesee 1989; De Houwer 1990; Gawlitzek-Maiwald und Tracy 1996; Paradis und Genesee 1996; Lanza 1997; Deuchar und Quay 2000). Aber auch einige der altbekannten Daten waren mit ihr nicht kompatibel. Nicht vergessen sollte man zum Beispiel, dass schon Ronjat (1913) bei seinem Sohn Louis eine sofort einsetzende Sprachtrennung feststellte. Heutzutage geht die Mehrzahl der Forscher und Forscherinnen von getrennten Sprachsystemen aus (z. B. De Houwer 2009; Müller et al. 2011). Die Fragestellung ist nun eine andere und zwar diskutiert man, ob und wie die beiden Sprachen in beschränktem Maße interagieren. Laut der independent development hypothesis von Bergman (1976, 88, 94) und der separate development hypothesis von De Houwer (1990, 2005, 2009, 277–287) findet, wie wir gesehen haben, keine Interaktion statt. Ab Ende der 1990er Jahre setzte sich allerdings immer mehr die Auffassung durch, dass die beiden sich entwickelnden Sprachen nicht hermetisch voneinander abgeschlossen sein können. Es handelt sich um eine Synthese der vorhin genannten gegensätzlichen Standpunkte. „The bilingual is not two monolinguals in one person.“ ‚Der Zweisprachige ist nicht zwei Einsprachige in einer Person‘, wie Grosjean (1989, 4) richtig unterstreicht. In einer holistischen Sichtweise sind bilinguale Individuen nicht die Summe von zwei vollständigen oder unvollständigen monolingualen Individuen, sondern ganzheitliche Entitäten mit einem speziellen linguistischen Profil.

Eine ganze Reihe von Hypothesen versucht seitdem, die Interdependenz und Interaktion der beiden Sprachen systematisch zu erfassen. Die dominant language hypothesis von Petersen (1988, 486) betrifft vor allem die Richtung der Sprachmischung. Sie nimmt an, dass die grammatischen Morpheme der stärkeren Sprache mit lexikalischen Morphemen beider Sprache verbunden werden, die grammatischen Morpheme der schwächeren Sprache jedoch nur mit lexikalischen Morphemen der schwächeren Sprache verbunden werden können. Bekannter ist die von Gawlitzek-Maiwald und Tracy (1996) formulierte bilingual bootstrapping hypothesis. Der auch im Deutschen verwendete Begriff des Bootstrapping und das davon abgeleitete Verb booten sind vor allem in der Informatik verbreitet und beziehen sich auf Vorgänge, bei denen mit Hilfe eines einfachen Programms komplexere Programme aktiviert werden. Beim Hochfahren eines Rechners ist typischerweise eine einfache Instruktion verantwortlich für eine Kette von Prozessen, an deren Endpunkt ein zur Funktion bereites Betriebssystem steht. Ursprünglich handelt es sich um eine schon früh in den USA geläufige metaphorische Übertragung von ‚sich selbst an den Stiefelschlaufen hochziehen‘, also eine Abwandlung der Münchhausen-Methode, auf jede Art von selbstinduziertem Prozess. In der Linguistik ist in den letzten Jahrzehnten ebenfalls oft von Bootstrapping die Rede, allerdings meistens in einem etwas anderen Sinn. Im Falle der frühkindlichen Zweisprachigkeit kann eine Eigenschaft in der Sprache A selbstverständlich keine notwendige Voraussetzung für eine Eigenschaft in der Sprache B darstellen. Bootstrapping bedeutet hier lediglich, dass eine bestimmte Eigenschaft der Sprache A eine Eigenschaft der Sprache B verstärken kann. Laut Gawlitzek-Maiwald und Tracy (1996, 903) können Strukturen der einen Sprache Erwerbsprozesse in der anderen Sprache fördern: „Something that has been acquired in language A fulfills a booster function for language B.“ ‚Etwas das in der Sprache A erworben wurde, erfüllt eine verstärkende Funktion für Sprache B.‘

Eine schwächere Fassung der Hypothese würde zumindest bedeuten, dass sprachliche Ressourcen temporär gemeinsam genutzt werden („temporary pooling of resources“). Im Bereich des Wortschatzes wurde schon vor Gawlitzek-Maiwald und Tracy (1996) vorgeschlagen, die Sprachmischung als temporäre Hilfsstrategie zu interpretieren, bei der Wörter der einen Sprache lexikalische Lücken der anderen Sprache füllen (beispielsweise Volterra und Taeschner 1978, 317; Genesee 1989, 167). Gawlitzek-Maiwald und Tracy (1996) meinen, dass dies auch auf der syntaktischen Ebene möglich sei. Besonders wenn sich die beiden Sprachen mit unterschiedlicher Geschwindigkeit entwickeln, könnten Strukturen, die in der stärkeren Sprache schon erworben wurden, den Erwerb von ähnlichen Strukturen in der schwächeren Sprache stimulieren. Die ivy hypothesis von Bernardini und Schlyter (2004) betrifft ebenfalls die Beziehung von zwei sich in einem Kind entwickelnden Sprachen und die Richtung der Sprachmischung. Die schwächere Sprache wächst wie Efeu, so die Annahme, auf dem Gerüst der grammatischen Strukturen der stärkeren Sprache.

Die cross-linguistic influence hypothesis von Hulk und Müller (2000) und Müller und Hulk (2001) beschäftigt sich ebenfalls mit der Interaktion der beiden Sprachen, geht aber über die vorhin beschriebenen Hypothesen hinaus. Sie stützt sich auf Gedanken von Paradis und Genesee (1996, 3 f.) und vor allem Döpke (1997, 1998). Da sie neben der Stimulierung auch die Verzögerung der einen Sprache durch die andere ins Auge fasst, erweitert sie die Hypothese von Gawlitzek-Maiwald und Tracy (1996). Auch sie geht von der grundsätzlichen Annahme zweier getrennter Sprachsysteme aus. Die beiden sich autonom entwickelnden Sprachsysteme können sich jedoch unter bestimmten Voraussetzungen gegenseitig beeinflussen. Der Spracheinfluss führt nicht zu einem gemischten oder fusionierten System, sondern manifestiert sich, wie von Paradis und Genesee (1996, 3 f.) angedeutet, als Transfer, Beschleunigung oder Verzögerung von grammatischen Eigenschaften. Das kann zu einer Sprachentwicklung führen, die sich von derjenigen eines monolingualen Kindes unterscheidet. Der Spracheinfluss betrifft lediglich Teilbereiche einer Sprache und hängt von der spezifischen Kombination der beiden von dem Kind erworbenen Sprachen ab. Hulk und Müller (2000, 228 f.) und Müller und Hulk (2001, 2) formulieren zwei Bedingungen für den Spracheinfluss. Erstens müssen sich die in Frage kommenden grammatischen Phänomene an der Schnittstelle zwischen Syntax und Pragmatik befinden. Die zweite und entscheidende Bedingung finden wir bereits in Döpke (1997, 106 f., 1998, 558 f., 581 f.). In bestimmten syntaktischen Bereichen müssen die beiden Sprachen überlappen. Genauer gesagt, die Sprache A verfügt über Konstruktionen, die zwei syntaktische Interpretationen zulassen, und in der Sprache B ist eine dieser beiden Interpretationen möglich. Ein wesentlicher Unterschied dieser Hypothese gegenüber der bilingual bootstrapping hypothesis ist demnach, dass der Spracheinfluss auf innersprachliche und strukturelle Faktoren zurückgeführt wird und nicht auf außersprach liche, wie beispielsweise ein starkes Kompetenzgefälle zwischen stärkerer und schwächerer Sprache (Yip 2013, 123).

Von Relevanz für den bilingualen Erstspracherwerb ist auch die von Paradis (1984, 1985, 1993, 2004, 2007) vorgeschlagene activation threshold hypothesis, die zu erklären versucht, wie mehrsprachige Individuen Sprache verarbeiten. Die Grundidee dieser psycho- und neurolinguistischen Hypothese ist, dass die Verfügbarkeit sprachlicher Elemente von der Häufigkeit ihrer Aktivierung und dem Zeitabstand zur letzten Aktivierung abhängt. Ein sprachliches Element wird erst dann aktiviert, wenn eine ausreichende Anzahl positiver neuronaler Impulse vorhanden ist. Diese Anzahl stellt die Aktivierungsschwelle dar (Paradis 1993, 138, 2004, 28). Die Schwelle ist dauernder Variation unterworfen. Jedes Mal wenn ein Element aktiviert wird, sinkt die Schwelle und weniger Impulse sind zu seiner Reaktivierung notwendig. Wenn jedoch ein Element über längere Zeit nicht reaktiviert wird, erhöht sich die Schwelle wieder. Je länger ein Element nicht aktiviert wird, desto höher steigt die Schwelle. Die Aktivierung eines neuronalen Elements hat zur Folge, dass sich die Aktivierungsschwelle potentieller Mitbewerber automatisch erhöht. Paradis (1993, 138, 2004, 28) spricht hier von Inhibition. Für das bilinguale Individuum bedeutet dies, dass durch die Aktivierung einer Sprache die Schwelle der zweiten Sprache erhöht wird, um Interferenzen zu unterdrücken. Der intensive Kontakt mit einer Sprache vermindert die Aktivierungsschwelle dieser Sprache und erhöht gleichzeitig die Schwelle der zweiten Sprache, wodurch sich in letzterer Sprachabbauphänomene wie Sprachmischung, Wortfindungsschwierigkeiten und so fort manifestieren können (Paradis 2007, 125–129). Die Hypothese ist zweifelsohne attraktiv, weil sie für den subjektiven Eindruck vieler multilingualer Sprecher und Sprecherinnen, die verminderte Verwendung eine ihrer Sprachen erschwere den Zugriff auf sie, eine theoretische neurolinguistische Erklärung bietet. Allerdings fehlen bis heute Studien, die einen eindeutigen Zusammenhang zwischen der verminderten Intensität des Kontaktes mit einer Sprache und ihrem Abbau nachweisen können (Dostert 2009, 47).

In der Forschung zum monolingualen Spracherwerb wird oft die Frage gestellt, wie es möglich ist, dass Kinder mit solch einer erstaunlichen Schnelligkeit neue Wörter lernen. Oftmals kennen sie ein neues Wort nach nur einmaligem Hören. Eine mögliche Erklärung dafür könnte sein, dass Kinder sich an kognitiven Leitlinien orientieren, welche die möglichen Wortbedeutungen einschränken (Tomasello 2003b, 84–87). Mit anderen Worten, Kinder würden beim Bedeutungserwerb dank kognitiver Prinzipien eine bestimmte Wortinterpretation einer anderen vorziehen. Zwei Prinzipien dieser Art könnten sein, dass sich ein Wort auf eine Klasse von Objekten bezieht, die sich gleichen, und dass sich ein Wort auf ein ganzes Objekt und nicht auf Teile davon bezieht (whole object assumption). Das bekannteste diesbezügliche Prinzip ist jedoch das principle of contrast (Clark 1987). Die von Markman und Wachtel (1988) angenommene mutual exclusivity assumption, im Deutschen Ausschließlichkeitsprinzip genannt (Szagun 2006, 145), bezeichnet zwar nicht genau das Gleiche, steht damit jedoch in engem Zusammenhang. Es handelt sich um die Annahme, laut der „any difference in form in a language marks a difference in meaning“ (Clark 1987, 2). Die Anwendung des Prinzips erleichtert den Kindern den Erwerb neuer Wörter, da es die möglichen Hypothesen über ihre Bedeutung einschränkt. Kinder nehmen beim Erwerb neuer Wörter an, dass sich zwei Wörter nicht auf das gleiche Objekt beziehen. Laut Clark (1987, 12) führt das allerdings dazu, dass Kinder anfangs Schwierigkeiten bei der semantischen Beziehung zwischen Unterbegriff und Oberbegriff haben. Wenn beispielsweise ein Erwachsener auf einen Hund zeigt und sagt Das ist ein Tier, wenden zwei- und dreijährige Kinder ein Nein, das ist ein Hund. Clark (1987, 13) nimmt an, dass das Kontrastprinzip auch bei bilingualen Kindern wirksam ist und in den Anfangsphasen des Spracherwerbs zur Vermeidung von Äquivalenten oder interlingualen Synonymen führt:

Young bilingual children face a similar problem. In the earliest stages of acquisition, they often accept only one label for a category despite exposure to a label from each language [...]. The result, from the young child’s point of view, is a single lexicon in which all terms should contrast.

‚Kleine zweisprachige Kinder stehen einem ähnlichen Problem gegenüber. In den frühesten Erwerbsphasen akzeptieren sie oft nur ein Etikett für eine Kategorie, obwohl sie in jeder Sprache mit einem Etikett konfrontiert sind [...]. Das Ergebnis ist, vom Standpunkt des Kindes, ein einziger Wortschatz, in dem alle Wörter zueinander in Opposition stehen.‘

Bilinguale Kinder würden jedoch früher als monolinguale Kinder zwei Wörter für das gleiche Objekt akzeptieren. Ab einem Wortschatz von 150 Wörtern würden sie merken, dass sie es mit zwei verschiedenen Sprachsystemen zu tun haben und das Kontrastprinzip nur innerhalb einer Sprache und nicht sprachübergreifend wirksam ist. In Clark (1993, 98) wird diese Grenze sogar auf 50 Wörter gesenkt. Es gibt allerdings Daten, sowohl von monolingualen als auch von bilingualen Kindern, die gegen das Kontrastprinzip sprechen. Blewitt (1994) weist nach, dass zwei- und dreijährige Kinder unter bestimmten Testbedingungen sehr wohl zwei Bezeichnungen für ein Objekt zulassen und gleichzeitig spezifische Unterbegriffe und Oberbegriffe akzeptieren (Tomasello 2003b, 73, 86). Eine Schildkröte kann also eine Schildkröte und ein Tier sein. Zwei- und dreijährige Kinder scheinen schon ein elementares Verständnis von semantischen Hierarchien zu haben. Die Erkenntnisse über Äquivalente im frühen bilingualen Erstspracherwerb stellen das Kontrastprinzip ebenfalls in Frage. Wie zahlreiche Studien nachweisen, treten Äquivalente auf, sobald zu Beginn des zweiten Lebensjahres die ersten Wörter und Holophrasen (Einwortäußerungen) produziert werden. Deuchar und Quay (2000, 59) stellen beispielsweise bei dem von ihnen beobachteten Kind im Alter von 0;10 bis 1;10 eine ganze Reihe von Äquivalenten fest und schließen daraus, dass das Kontrastprinzip in diesem Fall nicht zutreffen könne. Nur unter der Annahme, dass bilinguale Kinder von Beginn an über zwei getrennte Sprachsysteme verfügen, könne man das Kontrastprinzip aufrechterhalten (2000, 62).

3.3 Untersuchungs- und Forschungsmethoden

Die Daten, die zur Analyse der Fragestellungen und zur Überprüfung der Hypothesen herangezogen werden, stammen aus allen Bereichen der kommunikativen Kompetenz mehrsprachiger Kinder. Die ‚klassischen‘ Studien beschäftigten sich vornehmlich mit der Morphologie, der Syntax und dem Lexikon, seltener mit der Phonologie, wobei diese Bereiche recht isoliert voneinander betrachtet wurden. Auch neuere Untersuchungen fokussieren zumeist einzelne Bereiche, versuchen jedoch, diese innerhalb des gesamten kommunikativen Verhaltens vernetzt zu betrachten und zu analysieren.

Die in der Forschung zum bilingualen Erstspracherwerb eingesetzten Untersuchungsmethoden gehören zum gängigen Repertoire der Spracherwerbsforschung, der Psycholinguistik im Allgemeinen, der Neurolinguistik und teilweise auch der Soziolinguistik. Grundsätzlich kann man zwischen zwei Methoden oder empirischen Ansätzen unterscheiden, der Langzeituntersuchung und der Querschnittuntersuchung.

Die meisten der in den beiden nächsten Kapiteln beschriebenen Studien, etwa diejenigen von Ronjat (1913) oder Leopold (1939–1949), stellen den typischen Fall einer Langzeit-, Longitudinal- oder Längsschnittuntersuchung dar. In einer solchen Untersuchung wird der bilinguale Spracherwerb zumeist eines Kindes, seltener mehrerer Kinder, während eines bestimmten, manchmal jahrelangen Zeitraums systematisch beobachtet und registriert. Eine Langzeituntersuchung ist ein aufwändiges und arbeitsintensives Unterfangen, das einen oder mehrere Forscher und Forscherinnen über Jahre hinweg beschäftigt. Daher beschränken sich die meisten dieser Untersuchungen auf ein Kind oder günstigenfalls auf eine kleine Anzahl von Kindern. Da es sich um die Untersuchung einzelner Kinder, also einzelner Fälle handelt, spricht man auch von einer Fallstudie, im Englischen case study. Langzeituntersuchungen liefern ein genaues Bild der sprachlichen Entwicklung eines bilingualen Kindes. Dieser Umstand begünstigt die Formulierung von Hypothesen zum bilingualen Erstspracherwerb. Wie Yip und Matthews (2007, 57 f.) unterstreichen, stammen die meisten neueren Hypothesen und Theorien von Langzeituntersuchungen. Da diese Einzelfälle dokumentieren, sind sie jedoch bezüglich der allgemeinen Gültigkeit eines bestimmten Entwicklungsstadiums weniger aussagekräftig. Doch Forschungsergebnisse kumulieren sich und die Resultate einer einzelnen Langzeituntersuchung können jederzeit mit denjenigen vorhergehender Untersuchungen verglichen werden. Mit anderen Worten, eine Fallstudie dokumentiert zwar einen einzelnen Fall, findet jedoch nicht in Isolation, sondern vor dem Hintergrund anderer Untersuchungen statt (Deuchar und Quay 2000, 2).

Die Beobachtung der Kinder und die Registrierung ihrer sprachlichen Kompetenzen kann ganz unterschiedliche Ausmaße annehmen, zwei Methoden sind jedoch für Langzeituntersuchungen charakteristisch: Während die ersten Studien auf Tagebucheinträgen beruhten, stammt heutzutage ein Großteil der Daten von Audio- und/oder Videoaufnahmen. In jedem Fall, egal ob es sich um einfache Tagebucheinträge oder technisch anspruchsvolle Videoaufnahmen handelt, besteht ein im Prinzip unüberwindliches methodologisches Problem, das bekannte observer’s paradox:

The aim of the linguistic research in the community must be to find out how people talk when they are not being systematically observed; yet we can only obtain these data by systematic observation. (Labov 1972, 209)

‚Das Ziel der sprachwissenschaftlichen Forschung in der Sprechergemeinschaft muss sein herauszufinden, wie Menschen sprechen, wenn sie nicht systematisch beobachtet werden; doch wir können diesen Daten nur durch systematische Beobachtung erlangen.‘

Eine Konversation, die dadurch unterbrochen und eben auch verändert wird, dass der Forscher oder die Forscherin eine Äußerung des Kindes in das Tagebuch einträgt, ist ein typisches Beispiel für diese paradoxe Situation.

Tagebucheinträge hängen vom jeweiligen registrierungswürdigen Ereignis ab und erfolgen deshalb notwendigerweise in unregelmäßigen Zeitintervallen. Daten aus Tagebüchern beinhalten immer ein bestimmtes Maß an Subjektivität (McLaughlin 1978, 73). Ungewöhnliche oder nicht der Norm entsprechende Äußerungen werden mit größerer Wahrscheinlichkeit festgehalten als korrekte und unauffällige. Aus diesem Grund sind Tagebucheinträge weder repräsentativ noch für quantitative Rückschlüsse geeignet. Detaillierte und verlässliche Tagebucheinträge stellen jedoch eine wertvolle Ergänzung der Audio- und Videodaten dar. Seltene Phänomene, die in den Aufnahmen nicht zu Tage treten, können auf diese Weise erfasst und beschrieben werden. Yip und Matthews (2007, 72) weisen z. B. darauf hin, dass Relativsätze in ihren Aufnahmen kaum aufscheinen und die spezielle Entwicklung der pränominalen Relativsätze nur dank der Tagebucheinträge nachvollzogen werden kann.

Um speziell die Entwicklung des Wortschatzes festzuhalten, wird in heutigen Studien gelegentlich ein Lexikontagebuch geführt (Deuchar und Quay 2000; Klammler 2006; Klammler und Schneider 2011), in das die Eltern, wenn möglich täglich, die neuen Wörter des bilingualen Kindes eintragen. Die Tabelle 1 zeigt die Einträge im Alter von 1;4;11 aus Deuchar und Quay (2000, 15). Es gibt für solche Tagebücher kein spezielles Format. Entscheidend ist lediglich, dass die Eltern oder andere Beteiligte darin das Alter, das vom Kind verwendete Wort, die phonetische Transkription, die Bedeutung oder Bedeutungen des Wortes und Informationen zum außersprachlichen Kontext vermerken. Statt die Wörter des Kindes nach einer der beiden Sprachen zu klassifizieren, ist es sinnvoller, die Sprache der Gesprächspartner und -partnerinnen zu vermerken. Dadurch kann man später nachzeichnen, ob und wie sich das Kind an der Sprache der Gesprächspartner und -partnerinnen orientiert. Eine Klassifikation der Wörter nach Sprache ist hingegen oft schwierig, wenn nicht sogar unmöglich, da viele Wörter (onomatopoetische oder lautmalerische Wörter, in beiden Sprachen gleichlautende Wörter, Eigennamen) in beiden Sprachen verwendet werden. Überdies enthalten besonders in den frühen Phasen des Spracherwerbs die Wörter der Kinder zumeist nur eine oder zwei Silben, was die Zuordnung zusätzlich erschwert (De Houwer 2009, 178). Wie man an den Tabellen 2 und 3 in Kapitel 5 sehen kann, sahen sich Volterra und Taeschner (1978) deshalb gezwungen, eine zusätzliche Kategorie anzulegen (Gawlitzek-Maiwald und Tracy 1996, 909; Klammler und Schneider 2011).

Tab. 1: Einträge, Lexikontagebuch im Alter von 1;4;11 (Deuchar und Quay 2000, 15)

SituationWordGlossPronunciationAdditional informationLanguage of adult
breakfast at homegone[gɔ:]on finishing her cereal and juiceSpanish
breakfast at homebajarget down[ba]wanting to get down from her highchairSpanish
at home after breakfastpanda[pa]bringing mother a book showing pandaSpanish
leaving the housecasahouse[ka]pointing at the house from outsideSpanish
lunchtime at universityzapatoshoe[pa]referring to her shoeEnglish
arriving homecasahouse[ka]outside the houseSpanish
at homemásmore[ma]wanting more of somethingSpanish
at homebajarget down[ba]wanting to get downSpanish

Audio- und Videoaufnahmen finden in regelmäßigen Zeitintervallen statt. Der subjektive Faktor bei der Auswahl der zu beschreibenden Phänomene wird dadurch vermieden und die Daten können zu quantitativen und statistischen Zwecken herangezogen werden. Je kürzer die Intervalle sind und je länger die Aufnahmen, desto genauer und zuverlässiger ist selbstverständlich die Datenerfassung. Aufgrund vieler objektiver Beschränkungen, wie z. B. zeitliche Verfügbarkeit und Bereitschaft der Kinder und ihrer Eltern, verfügbare Räumlichkeiten, verfügbare technische Ausrüstung oder Dauer der Transkriptionsarbeit, liegen wöchentliche Aufnahmen im Ausmaß von einer Stunde schon an der oberen Grenze der Machbarkeit. Bei einer sich über ein oder zwei Jahre erstreckenden Beobachtungszeit ist die Menge der zu bearbeitenden und analysierenden Daten schon so enorm, dass sie im Normalfall auch bei einem einzigen beobachteten Kind nur von einer Forschergruppe bewältigt werden kann. Aber auch diese Daten können nur einen Bruchteil der kindlichen Äußerungen dokumentieren. Tomasello und Stahl (2004) schätzen, dass die im CHILDES-Datenbanksystem verfügbaren Aufnahmen jeweils nur ca. 1 % der vom Kind produzierten und gehörten Sprache erfassen. Häufige Sprachstrukturen treten in solchen Daten sicherlich an den Tag, seltene Erscheinungen können hingegen auch nach stundenlangen Aufnahmen fehlen, weshalb ich vorhin auf den Nutzen verlässlicher Tagebucheinträge hingewiesen habe. Die Dauer der Intervalle und Aufnahmen erweist sich dann als besonders wichtig, wenn bei Überlegungen zum Entwicklungsverlauf der Zeitpunkt des ersten Auftauchens einer Sprachstruktur bestimmt werden soll (Yip und Matthews 2007, 61).

Die Aufnahme spontaner kindlicher Sprachäußerungen muss sorgfältig geplant und vorbereitet werden. Die Umgebung und das Setting sollten kindgerecht und vor allem natürlich sein. Speziell dafür eingerichtete Räumlichkeiten bringen zwar technische Vorteile, stellen meistens jedoch im Unterschied zum gewohnten Spielzimmer des Kindes eine neue Umgebung dar. Wichtig ist eine ungezwungene Atmosphäre, da Kinder rasch herausbekommen, dass sie im Mittelpunkt des Geschehens stehen, und die Erhebung dadurch verfälscht werden kann. Bei bilingualen Kindern sollten je Sprache unterschiedliche Gesprächspartner und -partnerinnen zur Verfügung stehen. Diese sind idealerweise Personen, mit denen das Kind gewöhnlich Umgang hat und mit denen es vertraut ist (Mutter, Vater, größere Geschwister, enge Verwandte oder Freunde). Neue, ungewohnte Personen können das kindliche Sprachverhalten beeinflussen. Aus diesem Grund ist die Anwesenheit des Forschers oder der Forscherin nur in Ausnahmefällen empfehlenswert. Wenn es technisch und organisatorisch machbar ist, sollte man deshalb die jeweiligen Gesprächspartner und -partnerinnen bezüglich Aufnahmedauer, -intervall und -modus unterweisen und ihnen danach die Aufnahme ganz überlassen, wie das in den Studien von Lanza (1997), Klammler (2006) und Koroschetz (2008) gehandhabt wurde.

Zur Transkription gesprochener Sprache gibt es eine ganze Reihe erprobter Verfahren und Formate. In der Spracherwerbsforschung werden die Aufnahmen zumeist gemäß dem CHAT-Format (Codes for the human analysis of transcripts) transkribiert und annotiert. Es handelt sich um ein Format, das für die Transkription gesprochener Sprache nicht unbedingt das geeignetste ist. Denn wie bei jedem vertikalen oder sequenziellen Transkriptionsformat kann das gleichzeitige Sprechen von zwei oder mehreren Gesprächsteilnehmern nur schwer dargestellt werden. Das CHAT-Format sieht darüber hinaus für jede Äußerung eine neue Zeile vor und zwingt dadurch automatisch zu einer Segmentierung in Redeeinheiten. CHAT wird deshalb bei der Transkription von Gesprächen zwischen Erwachsenen selten angewendet (eine der wenigen Ausnahmen ist das C-ORAL-ROM-Corpus; Cresti und Moneglia 2005). Es hat aber in der Forschung zum mono- und bilingualen Spracherwerb große Verbreitung und kann als Standard betrachtet werden. Das Format wurde im Rahmen des CHILDES-Datenbanksystems (Child language data exchange system; http://childes.psy.cmu.edu/; MacWhinney 2000) entwickelt, das an der Carnegie Mellon University in Pittsburgh betrieben wird. Es ist verhältnismäßig leicht zu handhaben und wird durch spezielle Software und ausführliche Handbücher unterstützt. CHAT-konforme Transkripte können mit dem CLAN-Programm (Computerized language analysis) systematisch durchsucht werden. Der größte Vorteil des Formates ist die Möglichkeit, die standardisierten Transkripte nach Rücksprache mit den Administratoren in die Datenbank hochzuladen. Diese stehen dadurch der wissenschaftlichen Öffentlichkeit zur freien Konsultation zur Verfügung. Das CHILDES-Datenbanksystem enthält zurzeit mehr als 130 Korpora, d. h. Sammlungen von Aufnahmen, die nach einheitlichen Standards aus vielen verschiedenen Einzelsprachen erhoben wurden.

Ein Transkript im CHAT-Format besteht im Wesentlichen aus zwei Teilen (Abbildungen 2, 3 und 7). Der Transkriptkopf (header) enthält auf mehreren Zeilen, die alle mit dem @-Zeichen beginnen, Informationen über die Sprache, die Gesprächsteilnehmer, die Zeit, den Ort, die Aufnahmesituation und Ähnliches. Das eigentliche Transkript beginnt danach und enthält Zeilen mit dem *-Zeichen, gefolgt von der Abkürzung für die einzelnen Teilnehmer und von ihren Äußerungen. Erläuterungen zur Äußerungssituation, zu Elementen nonverbaler Kommunikation und zu anderen Faktoren werden in den von einem %-Zeichen und Abkürzungen eingeleiteten Kommentarzeilen unmittelbar unter eine Äußerungszeile geschrieben (Abbildung 3). Durch die Abkürzungen werden die Kommentare bestimmten Kategorien zugeordnet. Die Abkürzung sit z. B. bedeutet, dass es sich um eine situationsbezogene Information handelt, mit gls werden Glossen oder Übersetzungen angezeigt.

@Loc:Biling/Koroschetz/2de.cha
@Languages:deu
@Participants:CHI Manuel Target_Child, MOT Doris Mother
@ID:deu|koroschetz|CHI|2;10.14|male|||Target_Child|||
@ID:deu|koroschetz|MOT|||||Mother|||
@Transcriber:Carina
@Date:09-JUN-2007
@Location:Naples, Campania, Italy
@Situation:free playing with mother
*MOT:was willst du machen?
*MOT:die Schachtel willst du aufmachen?
*MOT:schaffst dus [: du es] alleine oder soll die Mama helfen?
*CHI:die Mama soll.
*MOT:hmm, was soll die Mama machen.
*CHI:sitz oben.
*MOT:wo sitzt du?
*MOT:was isn [: ist denn] das?
*CHI:ein Polster.
*MOT:ein Polster, was für ein Poster?
*CHI:von Winnie Puh.
*MOT:wie gehtn [: geht denn] das auf?
*MOT:schau auf der Seite macht man das auf, schau so.
*MOT:und was is(t) da drinnen?
*CHI:ein Zettel und ein +...
*MOT:das is(t) leer, die Schachtel ist nicht interessant, hmm?
*MOT:die machma [: machen wir] wieder zu.
*MOT:wart komm her, die Mama hilft dir.
*CHI:ein Zettel.
*MOT:so, und was spielma [: spielen wir] jetzt schönes?
*MOT:hmm, was magstn [: magst du denn] machen?
*CHI:tu jetz ein Pini machen.
*MOT:ein Picknick möchtest du machen?
*CHI:ein zest.
*MOT:ein Fest?
*CHI:ja.
*MOT:was für ein Fest?
*CHI:das ist ein Pinit.
[...]
@End

Abb. 2: Transkript im CHAT-Format (Koroschetz 2008 und http://childes.psy.cmu.edu)

@Loc:Biling/Koroschetz/1it.cha
@Languages:ita
@Participants:CHI Manuel Target_Child, FAT Gianni Father, MOT Doris Mother
@ID:ita|koroschetz|CHI|2;9.13|male|||Target_Child|||
@ID:ita|koroschetz|FAT|||||Father|||
@ID:ita|koroschetz|MOT|||||Mother|||
@Media:1it, audio
@Transcriber:Carina
@Date:09-MAY-2007
@Location:Naples, Campania, Italy
@Situation:free playing with father, reading a book
*FAT:che c’è?
*CHI:lila mamma.
%sit:The mother is sometimes present during the recording.
*FAT:lila?
*FAT:che cosa c’è di lila?
*CHI:le lil, le lil.
*FAT:ha, che cosa cerchiamo di lila?
*FAT:che cosa stiamo faccendo?
*CHI:so lila montare.
*FAT:montare lila cosa?
*CHI:lila dinari.
%gls:lila binario.
*FAT:lila?
*CHI:denari.
%gls:binari.
*FAT:denari?
*CHI:binari.
*FAT:binari!
*CHI:si.
*FAT:i binari lila, hoho.
*FAT:ma riusciamo a chiudere secondo te?
*CHI:si.
*FAT:pure secondo me riusciamo a chiudere bene.
*CHI:si.
*FAT:hoho, adesso che abbiamo chiuso ma che facciamo?
*CHI:camminare xxx su le lila con la lila binara.
[...]
@End

Abb. 3: Transkript im CHAT-Format (Koroschetz 2008 und http://childes.psy.cmu.edu)

Die Mehrzahl der in den Kapiteln 4 und 5 beschriebenen Studien sind nicht nur Langzeituntersuchungen, es sind auch Studien, in denen die Sprachentwicklung der eigenen Kinder beobachtet wurde. Die Tatsache, dass Eltern und beobachtende Sprachwissenschaftler und Sprachwissenschaftlerinnen in einer Person vereint sind, beinhaltet zweifelsohne eine Reihe von Vorteilen. Diese Personen genießen einen privilegierten und unkomplizierten Zugang zu den Kindern und haben genaue Kenntnis ihrer Lebensumstände und ihres sozialen Umfelds. Probleme betreffend Privatsphäre und Datenschutz sind einfacher zu lösen. Das Erstellen eines Lexikontagebuchs wird erleichtert, da die dafür notwendigen täglichen Beobachtungen ohnehin nur von den Eltern gemacht werden können. Die Nachteile dieser Methode dürfen jedoch nicht verschwiegen bleiben. Die Gefahr der Subjektivität ist erheblich, etwa bei der Auswahl der Einträge in das Lexikontagebuch (McLaughlin 1978, 73). Eltern tendieren zudem eher dazu, den Kindern ein größeres Wissen zuzuschreiben, als sie tatsächlich an den Tag legen (rich interpretation of data), und Kinderdaten in Kategorien der Erwachsenensprache zu fassen. Wie Deuchar und Quay (2000, 4), Garlin (2008 [2000], 45) und Yip und Matthews (2007, 7) meinen, überwiegen dennoch die Vorteile dieser Methode gegenüber ihren Nachteilen.

Als zweite grundsätzliche Erhebungsmethode kommt die Querschnittuntersuchung in Frage. Hier handelt es sich um eine Untersuchung, bei der zu einem bestimmten Zeitpunkt die sprachlichen Kompetenzen einer größeren Anzahl von bilingualen Kindern hinsichtlich spezifischer sprachlicher Phänomene erfasst werden. Die Phänomene sind meistens einige wenige oder überhaupt nur ein einzelnes. Eine Reihe von modernen Studien sind Querschnittuntersuchungen. Im Unterschied zur Forschung im monolingualen Erstspracherwerb, in der die meisten der angewendeten empirischen Verfahren entwickelt wurden, sind allerdings diesbezügliche Untersuchungen im bilingualen Erstspracherwerb ungleich aufwändiger. Während eine monolinguale Studie mit einer einzigen Gruppe von Versuchspersonen zu wissenschaftlich fundierten Ergebnissen kommen kann, sind in bilingualen Studien zumindest drei Gruppen notwendig: eine bilinguale Gruppe und je eine monolinguale Gruppe pro Sprache. Die bilinguale Gruppe muss noch dazu zweimal, also einmal pro Sprache, getestet werden. Pro untersuchtem Bereich führt eine solche Erhebung daher zu vier separaten Datensets.

Es ist bei Querschnittstudien entscheidend, dass die an der Untersuchung teilnehmenden Kinder eine möglichst homogene Gruppe in Bezug auf das Alter, den sozialen Hintergrund, das Geschlecht und weitere Faktoren bilden. Meistens wird das sprachliche Phänomen bei den Kindern mit Fragebögen oder Tests erhoben. Aufgrund der Anzahl der getesteten Kinder liefern Querschnittuntersuchungen ein genaues Bild eines momentanen Entwicklungsstadiums. Wenn eine Querschnittuntersuchung mit der gleichen Gruppe von Kindern in regelmäßigen Abständen wiederholt wird, entsteht eine Verbindung zwischen Querschnitt- und Langzeituntersuchung, die die Vorteile beider Untersuchungsverfahren kombiniert. Querschnittuntersuchungen mit altersmäßig gestaffelten Gruppen erlauben auch Rückschlüsse auf die sprachliche Entwicklung.

In der Forschung zum monolingualen Erstspracherwerb wurden in den letzten Jahren eine ganze Reihe von experimentellen Verfahren oder Testmethoden entwickelt, mit denen man die Kompetenzen der Kinder erheben kann. In vielen Erhebungen kommen vorgefertigte Fragebögen zum Einsatz, die dem Forscher oder der Forscherin die Arbeit entscheidend erleichtern. Elternfragebögen oder Elternchecklisten werden regelmäßig verwendet, um den momentanen Stand des Wortschatzes von monolingualen oder bilingualen Kindern zu erheben. Man legt den Eltern Listen von Wörtern vor und diese werden gebeten, anzugeben, welche davon ihr Kind bereits rezeptiv und/oder produktiv beherrscht. Typischerweise beherrscht ein Kind einen bestimmten Prozentsatz der Wörter auf der Liste. Der Prozentsatz wird dann mit dem prozentualen Richtwert verglichen, den Kinder ähnlichen Alters aufgrund von empirischen Untersuchungen normalerweise erreichen.

Der bekannteste Fragebogen, MacArthur communicative development inventories (CDI) genannt (Fenson et al. 1993; Fenson et al. 2006), enthält mehr als 600 Wörter aus verschiedenen semantischen Feldern, die den kindlichen Wortschatz wiedergeben. Er steht inzwischen in einer ganzen Reihe von Sprachen zur Verfügung. Die Eltern müssen lediglich die Wörter markieren, die ihr Kind versteht und produziert oder die es nur versteht, aber nicht aktiv produziert. Die Ergebnisse sind also nach aktivem und passivem Wortschatz klassifizierbar. Ein Fragebogen, der auf einer ähnlichen Methode beruht, aber heutzutage kaum noch zum Einsatz kommt, ist der Language development survey (LDS) (Rescorla 1989). Diese Fragebögen haben eine Reihe von Vorteilen. Sie sind vor allem dann hilfreich, wenn Kinder noch zu jung sind, um ohne Weiteres auf Vokabelfragen zu antworten. Ihr Einsatz ist nicht aufwändig und sie ermöglichen es, unter Mithilfe der Eltern in kurzer Zeit Auskunft über den Wortschatz einer repräsentativen Gruppe von Kindern zu erhalten. Sie sind standardisiert und garantieren somit größtmögliche Vergleichbarkeit. Obwohl am besten für Querschnittuntersuchungen geeignet, können sie auch in Langzeituntersuchungen angewendet werden. Allerdings sollten sie nicht die alleinige Erhebungsmethode darstellen. Überhaupt raten Junker und Stockman (2002, 392), Elternfragebögen, so wie auch andere elterliche Aufzeichnungen, in jedem Fall mit der direkten Beobachtung der Sprachproduktion zu kombinieren bzw. zu ergänzen. Elternchecklisten sind keine exhaustiven Wortschatzlisten, sondern stellen nur eine Auswahl an Wörtern zur Verfügung. Manches alltägliche Wort kann darin fehlen. Das bedeutet, dass die CDI-Elterncheckliste zum Beispiel nicht wirklich die genaue Anzahl der von einem Kind zu einem bestimmten Zeitpunkt beherrschten Wörter angeben kann (De Houwer, Bornstein und De Coster 2006, 343; David und Wei 2008, 603; De Houwer 2009, 73). Gentner und Boroditsky (2009, 24) merken außerdem an, dass durch diese Methode die Erfassung von Eigennamen verhindert wird, wenn die Eltern nicht explizit auf diesen Umstand aufmerksam gemacht werden.

Um die Sprache von Kindern im Grundschulalter zu erheben, wird oft mit Bildimpulsen oder Bildergeschichten gearbeitet. Diese sind sprachunabhängig (aber meist nicht vollkommen abgekoppelt von einer typisch westlichen Kultur) und können so in jeder beliebigen Sprache abgefragt werden. Die bekannteste und verbreitetste Geschichte ist das Bilderbuch Frog, where are you? (Mayer 1969), das oft einfach Frog story genannt wird. Es eignet sich vor allem zur Analyse der Versprachlichung von temporalen Abläufen und der Strukturierung von Information. Damit wurden bereits zahlreiche Erhebungen durchgeführt (Berman und Slobin 1994; Strömqvist und Verhoeven 2004; Mulec 2013). Einige davon sind in der CHILDES-Datenbank (http://childes.psy.cmu.edu/) in einem Frog story corpus zusammengefasst.

Im Gegensatz zu den bisher genannten Methoden, die vor allem die Sprachproduktion erheben, wird mit Hilfe des Peabody picture vocabulary test (PPVT) spezifisch das Sprachverständnis gemessen. Es handelt sich um einen bekannten, ursprünglich von Dunn (1959) für das Englische entworfenen Test zur Ermittlung des passiven Wortschatzes. Dunn und Dunn (1981) publizierten eine modifizierte und verbesserte Version des Tests, den Peabody picture vocabulary test-Revised (PPVT-R). Inzwischen existieren noch weitere Überarbeitungen des Tests (PPVT-III; Dunn und Dunn 1997) sowie eine Reihe von Versionen für andere Sprachen. Der Test wird gern als Eingangstest verwendet, um Informationen über den passiven Wortschatz der Probanden zu bekommen und diese verschiedenen Untersuchungsgruppen zuordnen zu können. Die Testungen werden individuell mit dem Kind durchgeführt. Der Test ist rein gestisch, d. h. das Kind muss weder lesen noch schreiben, ja nicht einmal sprechen können. Dem Kind wird ein Blatt mit vier Schwarzweißzeichnungen vorgelegt, während die testende Person ein Wort sagt. Die Aufgabe besteht darin, auf dasjenige Bild zu zeigen, das die Bedeutung des Wortes am besten wiedergibt. Die Kinder können auf die Zeichnung zeigen oder die der Zeichnung entsprechende Zahl sagen. Da gleich am Beginn der Testung das vom Alter des Kindes abhängende Ausgangsniveau ermittelt wird, werden nur diejenigen Wörter gefragt, die über dem altersgemäßen Ausgangsbereich liegen. Somit vermeidet man die Testung von Wörtern, die dem Kind bereits seit Jahren bekannt sind.

In den letzten Jahren werden verstärkt experimentelle Untersuchungen zur Perzeption und Sprachverarbeitung von Neugeborenen und Säuglingen gemacht. Hier kommen selbstverständlich ganz andere Untersuchungstechniken zur Anwendung. Zumeist macht man sich das Blickverhalten oder den Saugrhythmus der Babys zunutze (Klann-Delius 2008; Johnson und Zamuner 2010; Sedivy 2010). Klann-Delius (2008, 16 ff.) unterscheidet drei experimentelle Verfahren. Schon Säuglinge können Objekte und Personen mit dem Blick erfassen und für längere Zeit fixieren. Man spricht von Präferenzparadigma, wenn dem Säugling mehrere Gesichter präsentiert werden und die Fixationsdauer zeigt, ob er das Gesicht der Mutter erkennt. In der englischsprachigen Psycholinguistik verwendet man hier den Ausdruck preferential looking ‚bevorzugte Blickzuwendung‘. Die Methode kann auch abgewandelt werden. Man kann fremde Gesichter mit verschiedenen Stimmen reden lassen, eines davon mit der Stimme der Mutter. Blickt das Baby häufiger auf dieses Gesicht, ist anzunehmen, dass es eine Präferenz für die Stimme der Mutter hat. Die Messung der Saugfrequenz eignet sich vor allem für Experimente nach dem Habituationsparadigma. Hier wird dem Baby ein Seh- oder Hörreiz dargeboten. Wenn der Reiz zum ersten Mal präsentiert wird, steigt normalerweise die Saugfrequenz, um nach einer Weile wieder zu sinken. Das Baby hat sich an den Reiz gewöhnt und nuckelt wieder still vor sich hin. Dann wird der Reiz in einem Merkmal verändert und dem Baby noch einmal dargeboten. Wenn die Saugfrequenz des Babys nun wieder merklich steigt, hat es die Merkmalsveränderung wahrgenommen. Man kann z. B. dem Baby den Konsonanten [l] mehrmals vorspielen und ihn anschließend langsam akustisch zu einem [r] transformieren. Steigt seine Saugfrequenz ab einem bestimmten Punkt, kann man annehmen, dass es die beiden Konsonanten unterscheidet. Experimente nach dem Überraschungsparadigma zeigen, wie bereits kleine Kinder Reize anhand von Vorerwartungen und Schemata verarbeiten. So reagieren Babys überrascht, wenn in einer Filmsequenz mit der Mutter plötzlich aus deren Mund eine fremde Stimme ertönt.

Die neurolinguistischen Hypothesen von Penfield und Roberts (1959) und Lenneberg (1967) beruhten allein auf Untersuchungen der Auswirkung von Hirnläsionen. In den letzten Jahren ermöglichen jedoch moderne Methoden der neuronalen Bildgebung die Beobachtung des intakten Gehirns (Wahl 2009, 10; Kuhl 2010, 713–715; Li 2013, 221–223). Zwei davon, die funktionelle Magnetresonanztomographie (fMRT) und ereigniskorrelierte Potentiale (EKP), sind besonders bedeutsam. Dank der unterschiedlichen magnetischen Eigenschaften von oxygeniertem und desoxygeniertem Blut machen fMRT-Aufnahmen die Veränderungen der Durchblutung von Hirnarealen sichtbar. Werden Kortexareale aktiviert, kommt es zu einer Erhöhung des Blutflusses aufgrund des gesteigerten Energiebedarfs. Dadurch steigt die Konzentration von oxygeniertem relativ zu desoxygeniertem Hämoglobin. Die räumliche Auflösung ist in der Größenordnung von Millimetern, also sehr präzis. Ereigniskorrelierte Potentiale sind Wellen im Elektroenzephalogramm in der Größenordnung von Millisekunden, die mit neuronaler Aktivität, wie Sinneswahrnehmungen, erhöhte Aufmerksamkeit und Sprachverarbeitung, korrelieren. Allerdings ist der Ursprung der elektrischen Veränderungen schwer neuronal zu lokalisieren, weshalb sich die beiden Methoden hinsichtlich ihrer bildgebenden Möglichkeiten ergänzen (Li 2013, 223). Während man mit der fMRT-Methode ein Hirnareal, in dem eine neuronale Aktivität stattfindet, räumlich genau bestimmen kann, ist die zeitliche Auflösung aufgrund der Langsamkeit der Blutflussveränderungen ungenau. Der zeitliche Ablauf neuronaler Aktivitäten kann besser mit der EKP-Methode erfasst werden.

Ein Maßstab, der in der Forschung zum monolingualen und auch bilingualen Spracherwerb oft eingesetzt wird, ist die durchschnittliche Äußerungslänge (engl. mean length of utterance, MLU). Sie wurde zunächst von Brown (1973) für das amerikanische Englisch entwickelt und seither auch in vielen anderen Sprachen angewendet. Die MLU kann sowohl in Morphemen (MLUm) als auch in Wörtern (MLUw) gemessen werden. Mit Morphem bezeichnet man die kleinste sprachliche Einheit mit einer Bedeutung oder grammatischen Funktion. Die MLUm wird besonders bei der Messung des grammatischen Fortschritts angewendet und hat sich dort bewährt. Warum das so ist, kann man anhand eines einfachen Beispiels verstehen. Ein Wort wie Enten besteht aus zwei Morphemen, dem Stammmorphem Ente und dem Pluralmorphem -n. Wenn nun ein Kind gelegentlich nicht nur das Wort Ente, sondern auch das Wort Enten äußert, darf man annehmen, dass es eine Möglichkeit der Pluralmarkierung erworben hat. Diesem grammatischen Fortschritt wird durch die Berücksichtigung der Morpheme Rechnung getragen. Zur Berechnung der MLUm einer Stichprobe zerlegt man ihre Äußerungen zuerst in Morpheme und dividiert anschließend die Gesamtzahl der Morpheme der Stichprobe durch die Anzahl ihrer Äußerungen. Im Folgenden aus Szagun (2006, 81) stammenden Beispiel wird die MLUm auf der Basis von sieben Äußerungen eines Kindes berechnet:

(1) Kindliche ÄußerungenAnzahl der Morpheme
*FAL: ab.1
*FAL: fal-‘n.2
*FAL: katze raus.2
*FAL: nichs ab#ge#mach-t.5
*FAL: will d-en.3
*FAL: moecht-e kein-e mau&aeus-e fang-‘n.9
*FAL: da is oben ein boes-er huhu.7
Summe:29 Morpheme
MLUm = 29/7 = 4,14

Allerdings kann der Grammatikerwerb nur bis zu einer MLUm von ca. 5,0 bis 6,0 abgebildet werden, danach verliert die MLUm an Aussagekraft (Szagun 2006, 83), da die Situationsbedingtheit der Sprache immer mehr an Einfluss gewinnt.

Selbstverständlich ist die Morphemgliederung sprachspezifisch und im Grunde nicht von einer Sprache auf eine andere übertragbar (De Houwer 1990, 15). Abgesehen davon bestehen bei vielen Sprachen unterschiedliche Auffassungen hinsichtlich der Segmentierung in Morpheme. Die konkreten MLUm-Werte können deshalb auch vom theoretischen morphologischen Ansatz abhängig sein. Zusätzlich hängen die MLUm-Werte so wie auch die MLUw-Werte vom Sprachtyp ab. In agglutinierenden Sprachen, in denen fast jede grammatische Kategorie durch ein eigenes Morphem ausgedrückt wird, hat die Anzahl der Morpheme ein anderes Gewicht als in synthetischen Sprachen, in denen mehrere grammatische Kategorien in einem Morphem verpackt auftreten oder grammatische Kategorien durch Allomorphe ausgedrückt werden. In analytischen Sprachen ist hingegen prinzipiell die Anzahl der Wörter pro Äußerung größer als in synthetischen Sprachen.

Im bilingualen Erstspracherwerb wird, weil nur wenige bilinguale Korpora morphologisch codiert sind, zumeist die MLUw als Maßstab angewendet. Die MLUw wird hier in erster Linie benutzt, um ein eventuelles Ungleichgewicht zwischen den Sprachen festzustellen. Yip und Matthews (2007, 76–81) berechnen hierzu die individuellen Unterschiede in der MLUw (MLU differentials) zwischen den beiden Sprachen (Englisch und Kantonesisch) der von ihnen untersuchten Kinder. Wenn man die Variation der MLUw auf eine Zeitachse projiziert, kann man anhand der grafischen Darstellung die Entwicklung der beiden Sprachen nachvollziehen. Bei dieser Darstellung ist nicht so sehr die Variation zwischen den beiden Sprachen relevant, sondern die Variation innerhalb einer Sprache auf der Zeitachse. Wie man an der Abbildung 4 erkennen kann, entwickeln sich z. B. die beiden Sprachen von Timmy insgesamt gesehen in etwa gleich weit, obwohl ihre jeweiligen Anfangs- und Endpunkte unterschiedlich sind. Die MLUw von Timmys Englisch macht allerdings bis 2;8 kaum Fortschritte während nach 2;9 ihre Variation in beiden Sprachen vergleichbar ist.


Abb. 4: MLU-Unterschiede bei Timmy (Yip und Matthews 2007, 76)

Bilingualer Erstspracherwerb

Подняться наверх