Читать книгу Gesprochenes Portugiesisch aus sprachpragmatischer Perspektive - Bernd Sieberg - Страница 11
3. Benutzte Korpora, Transkriptionen, Abkürzungen und weitere Hinweise zur Erleichterung der Lektüre des Buches
ОглавлениеDer weitaus überwiegende Teil der Transkriptionen, die in der vorliegenden Studie als Beispiele herangezogen werden, wurde mir freundlicherweise von Mitarbeitern des CLUL kostenfrei zur Verfügung gestellt1. Sie entstammen dem ‚C-ORAL-ROM-Korpus‘ (Integrated Reference Corpora for Spoken Romance) des CLUL. Bei den Beispielen handelt es sich um 152 Gespräche mit rund 300000 Wörtern, die in den Jahren 1970 und 1998, aber zum überwiegenden Teil im Jahr 2001 aufgenommen wurden. Die spontan geführten Gespräche finden zwischen zwei oder mehr Gewährspersonen statt, die sich über verschiedene alltägliche Themen unterhalten. Das abschließende Korpus wurde im Jahre 2001 von einer Arbeitsgruppe der CLUL bearbeitet und transkribiert2. Nähere Informationen zum Korpus und seiner Entstehung sowie der für die Transkription verwendeten Transkriptionszeichen findet man in den online einsehbaren Aufsätzen von Cresti et al. (2002) und Mendes et al. (2003) 3. Die in der vorliegenden Untersuchung benutzten Beispiele stützen sich unter Ausrichtung am Untersuchungsziel dieser Arbeit ausschließlich auf die literarischen Transkriptionen des Korpus, die im ‚txt-Format‘ vorliegen. Beispiele aus diesem Korpus werden in folgender Form gekennzeichnet: (1) C-ORAL-ROM ‚pnatco02.txt‘ – Religion und Persönlichkeitsentwicklung. Durch die in Klammern stehenden Nummern werden die Beispiele zu einem Themenbereich durchnummeriert, während nach dem Gedankenstrich am Ende das im Gespräch fokussierte Thema genannt wird.
In den folgenden Paragraphen werden die Transkriptionszeichen, die ich aus den Originaltranskriptionen übernommen habe, aufgelistet und erklärt. Im Hinblick auf die pragmatische Ausrichtung des Konzepts des Buches und die Einteilung der thematisierten sprachlichen Merkmale auf der Basis unterschiedlicher universaler Diskursverfahren des Nähe- und Distanzmodells von Ágel / Hennig wurden die Originaltranskriptionen der Beispielsätze des ‚C-ORAL-ROM-Korpus‘ so weit wie möglich vereinfacht und alle gemessen an dieser Zielsetzung überflüssigen Symbole und Transkriptionszeichen4 weggelassen, um die Leserlichkeit der Textbeispiele zu erhöhen:
L, T, S, … etc.: | Mittels von Großbuchstaben abgekürzte Namen der Personen – künftig auch als ‚Gewährspersonen‘ bezeichnet, die an einem Gespräch teilgenommen haben. L entspricht Luís, T steht für Teresa, S für Sara etc. |
Zusätzliche Informationen: | Ergänzende Informationen zu den Aufnahmesituationen, den Gewährspersonen und behandelten Themen, füge ich in Form von Abkürzungen den Transkriptionen hinzu. Zum Beispiel bedeutet die Buchstabenfolge ‚ptelpv11.txt‘ ‚Dialog am Telefon‘, ‚ppubdl10.txt‘ steht für ‚Dialog‘ und ‚ppubmn07.txt‘ kennzeichnet eine ‚monologische Gesprächssequenz‘. Zusätzlich habe ich noch in Stichworten angemerkt, worüber sich die Personen jeweils unterhalten und alle Informationen wie im folgenden Beispiel annotiert: (13) C-ORAL-ROM ‚pfamcv02.txt‘ – Anwälte und Kleiderordnung. |
/ : | Ein Schrägstrich markiert eine kurze Pause in einer Intonationseinheit, die aber noch nicht an ihr Ende gelangt ist5. Die Länge einer solchen Pause wird nicht objektiv (z.B. in Sekunden oder Sekundenbruchteilen) angegeben. Stattdessen dient als Kriterium dieser Definition das subjektive Empfinden eines kompetenten Sprechers des Portugiesischen. |
// : | Zwei nebeneinander stehende Schrägstriche bedeuten, dass ein Sprecher seine Intonationseinheit beendet hat. Außerdem weisen sie auf eine zeitlich ausgedehntere Pause zwischen Äußerungen, wobei aber exakte, objektiv nachvollziehbare Aussagen über die Länge der jeweiligen Pausen fehlen. |
… : | Drei hintereinander gestellte Punkte stehen für eine vom Sprecher nicht zu Ende geführte Äußerung. Einen möglichen Grund dieses Abbruchs sehen die Autorinnen des CLUL z.B. darin, dass es sich bei der begonnenen Äußerung um ein Sprichwort handelt, das darum nicht beendet wird, weil jedem kompetenten Sprecher des Portugiesischen das passende Ende bereits bekannt sein dürfte, wie águas passadas não… 6. Man sollte aber ausdrücklich hinzufügen, dass es sich nicht um Anakoluthe handelt, deren Erscheinen in einer diskursiven Sequenz auf andere Gründe verweist7. |
[…] : | Diese in eckige Klammern gesetzten Punkte ersetzen Textstellen, die aus den Originaltranskriptionen herausgenommen werden. Ich lasse sie weg, wenn sie für die Veranschaulichung und Interpretation der thematisierten sprachlichen Erscheinung unerheblich sind. |
< > : | Eckige Klammern bedeuten, dass die sich zwischen ihnen befindlichen Teile der Sprechsequenz teilweise oder gänzlich mit Teilen der Äußerungen des Gesprächspartners überschneiden. |
[<] < > : | Dieses Zeichen verweist darauf, dass ein Sprecher die Äußerung seines Gegenübers weiterführt – es handelt sich also um eine Form der Adjazenz –, wobei diese Weiterführung parallel zur Äußerung des Gesprächspartners verläuft. |
Im Laufe meiner Arbeit hat das ‚Mike-Davies-Korpus‘8 mit der Bezeichnung O Corpus do Português, das über die vergleichsweise riesige Zahl von 450 Millionen (Género / Histórico) bzw. 1 Billionen (Web /Dialetos) Wörtern verfügt, zunehmend an Bedeutung gewonnen. Bei der ersten Variante dieses Korpus handelt es sich um ein ‚kleineres‘ Korpus, das durch Sprachwandel verursachte Veränderungen der Wörter erfasst und sich mit Wörtern aus dem 13. bis hin zum 20. Jahrhundert besonders für die historische Erforschung der portugiesischen Sprache anbietet. Das zweite wesentlich umfangreichere Korpus hingegen, dessen Einträge in den Jahren 2013 und 2014 gesammelt und aufgearbeitet wurden, berücksichtigt sprachgeographische Varianten des Portugiesischen aus Brasilien, Angola und Mozambique und eignet sich darum besonders für synchrone Studien. Weil diese Korpora aber keine Visualisierung dialogischer Strukturen ermöglichen, sondern ausschließlich monologische Passagen als jeweilige Kontexte eines Lemma angegeben sind, habe ich diese Korpora nur zur Ergänzung und zur Analyse sprachlicher Ausdrücke und Erscheinungen benutzt, deren Interpretation ohne die Berücksichtigung dialogischer Kontexte auskommt. Im Text werden Übernahmen aus diesem Korpus mittels der Abkürzung MD gekennzeichnet.
Einige Beispiele aus monologischen Diskurssequenzen stammen aus dem Korpus von Maria de Fátima Viegas Brauer-Figueiredo. Dabei handelt es sich um Transkriptionen mit insgesamt 154584 Wörtern als Ergebnis von Interviews, die in den Jahren von 1984 bis 1994 stattgefunden haben. Die Autorin hat dieses Material und ihre auf Deutsch verfassten Interpretationen in dem Buch „Gesprochenes Portugiesisch“ (1999) veröffentlicht. Ursprünglich handelte es sich um den Versuch, die Zweisprachigkeit portugiesischer Immigranten der zweiten Generation in Hamburg zu analysieren. Dabei gelangte die Autorin aber schließlich zu der Erkenntnis, dass die erzielten Ergebnisse generelle Aufschlüsse über Charakteristika des gesprochenen Portugiesisch ermöglichen. Mit der Veröffentlichung „Gesprochene Sprache in der Romania: Französisch, Italienisch, Spanisch“ von Koch / Oesterreicher im Jahre 1990 und vor dem Hintergrund der Ergebnisse und der benutzen Methode dieser Arbeit änderte Viegas Brauer-Figueiredo schließlich das Untersuchungsziel ihrer Arbeit und wertete sie als Versuch, das von Koch / Oesterreicher benutzte Konzept auf die Untersuchung des gesprochenen Portugiesisch anzuwenden. So erfasst das Korpus nach Aussagen der Autorin insgesamt 3.459 Ausdrücke und Strukturen, die charakteristisch für diese Variante sind. Entsprechend vergrößerte Viegas Brauer-Figueiredo auch den vom Korpus erfassten Kreis der interviewten Personen sowie der berücksichtigten kommunikativen Praktiken. Dazu gehören: (a) Interviews und Gespräche mit portugiesischen Immigranten der zweiten Generation in Hamburg, (b) Gruppengespräche und Interviews mit Studierenden von drei verschiedenen portugiesischen Universitäten, (c) Interviews von Personen unterschiedlicher Sozialschichten, Berufen und Altersgruppen, die auf dem portugiesischen Festland, auf den Azoren sowie auf den Kapverden durchgeführt wurden, (d) Auszüge aus Vorträgen, Diskussionen und Gesprächen zwischen Schriftstellern, Moderatoren und Personen aus dem Publikum in Hamburg, (e) Auszüge aus Vorlesungen, Seminaren und Kolloquien von portugiesischen Gastprofessoren an der Universität Hamburg und (f) Mitschnitte aus portugiesischen Fernsehsendungen.
Die resultierende Heterogenität dieses Korpus sowie der Umstand, dass die dialogischen Abläufe von Dialogen nicht visualisiert werden, wie es z.B. das gesprächsanalytische Transkriptionssystem GAT mit seiner „Textnotation“ (üblich bei Transkriptionen des IDS) ermöglicht, schränkt die Benutzung dieses Korpus für die in dieser Studie definierten Ziele entscheidend ein. Diese Transkriptionen werden an dieser Stelle darum ausschließlich zur Erklärung von sprachlichen Erscheinungen benutzt, die sich auch aus den monologischen Strukturen der erfassten Diskurssequenzen erschließen. In der vorliegenden Arbeit sind die wenigen Beispiele aus diesem Korpus mittels der Kürzel VBF. Zusätzlich hinzugefügte Zahlen geben jeweils die Seite des Buches an, aus dem das Beispiel stammt.
Die Beispiele aus dem Bereich „keyboard-to-screen communication“ (Jucker / Dürrscheid 2012, 40) stammen aus einer von mir verfassten Studie aus dem Jahre 2013 zur Kommunikationsplattform ‚Twitter‘ (Sieberg 2013b). Es handelte sich um das internationale Forschungsprojekt „Microblogs global“, das an der Universität Hannover und mittels des Internetportals „mediensprache.net“9 unter Leitung von Siever und Schlobinski durchgeführt wurde. Damals wurden die kommunikative Praktik des Twitterns sowie die Rahmenbedingungen und sprachlichen Besonderheiten ihrer Nutzung aus der Perspektive von zehn Sprachen und elf Ländern – Chinesisch, Deutsch, Englisch, Französisch, Italienisch, Japanisch, Niederländisch, Portugiesisch, Russisch, und Spanisch – untersucht. Dabei fiel mir die Rolle zu, die Funktionsweise dieser Kommunikationsplattform und die beim Twittern benutzte Sprache für Portugal zu analysieren. Das Ergebnis dieser Arbeit liegt in Form des Artikels „Microblogs global: Portugiesisch“ des oben erwähnten Buches (Siever / Schlobinski 2013, 231–253) vor. Die Datenerhebung, Zusammenstellung und Auswertung der Tweets erfolgte in den Jahren 2010 und 2011 und umfasst insgesamt 640 Tweets in portugiesischer Sprache, mit insgesamt 8156 Wörtern aus 64 Accounts. Bei den Twitterern handelte es sich zur Hälfte um weibliche und bei der anderen Hälfte um männliche ‚User‘. Im Gegensatz zum ‚C-ORAL-ROM-Korpus‘ wurden die vorgefundenen sprachlichen Ausdrücke in ihrer ursprünglichen Form belassen. Unberücksichtigt blieb dabei, dass die von den Twitterern benutzen Formen oft von der Standardorthographie und den graphostilistischen Normen der portugiesischen Schriftsprache abwichen. Die am Projekt beteiligten Forscher waren sich des Umstandes bewusst, dass es insbesondere diese ‚Fehler‘ sind, die Aufschlüsse darüber liefern, wie ‚User‘ den verbalen Code unter Ausnützung der spezifischen Möglichkeiten der Kommunikationsplattform Twitter zur Informationsübermittlung einsetzen.
Die entsprechenden Quellen für die analysierten Beispiele zum Portugiesischen werden im Text folgendermaßen gekennzeichnet: (5) Korpus Sieberg (2013b) – Microblogs global: Portugiesisch. Einige wenige Beispiele wurden, wenn erforderlich, auch dem von mir aufgestellten Korpus zum Sprachgebrauch in portugiesischen Weblogs (Sieberg 2006b) entnommen. Die entsprechende Kennzeichnung erfolgt mittels der Markierung Korpus Sieberg (2006b) – Weblogs in Portugal.
Der Grund, warum diese Computer vermittelten Kommunikationsformen mit in die vorliegende Untersuchung einbezogen werden, liegt hauptsächlich an der oft dialogischen Form der sequentiellen Abläufe dieser peripheren Formen des Nähesprechens, die sprachliche Ausdrücke und Strukturen hervorbringen, die denen der prototypischen Formen des Nähesprechens – Alltagsdialoge in all ihren Varianten – ähneln. Ich denke in diesem Zusammenhang u.a. an das Vorkommen von ‚Reaktiven‘, von Varianten einer ‚aggregativen Rezeptionssteuerung‘ sowie von ‚adjazenten Strukturen‘ und die aus ihnen resultierenden ‚elliptischen Ausdrucksweisen‘ etc.
Die relativ beschränkte Zahl von Korpora und Transkriptionen, die bei der vorliegenden Studie als Beispiele genannt werden, lässt sich dadurch rechtfertigen, dass ich mit dieser Arbeit nicht die Intention verbinde, statistisch erhärtete Nachweise für die Gültigkeit von Hypothesen hinsichtlich des Vorkommens bestimmter sprachlicher Phänomene aufzustellen. Im Fokus des Interesses stehen vielmehr generelle Aussagen zum mündlichen / nähesprachlichen Gebrauch des verbalen Codes im Portugiesischen sowie der Veranschaulichung und Erläuterung von sprachlichen Erscheinungen, die diese Verwendungsweise charakterisieren bzw. erst ermöglichen.
Bei Zweifeln hinsichtlich der im Text verwendeten Begriffe wird den Lesern empfohlen, das Glossar, das sich am Ende des Buches befindet, als Verständnishilfe heranzuziehen.
Für die Zitate – ausgenommen diejenigen, in denen die ursprüngliche Schreibweise nicht verändert wurde – übernehme ich bei Sätzen auf Portugiesisch die Regeln der Orthographiereform – Acordo Ortográfico da Língua Portuguesa –, die in Portugal seit 2009 offiziell gelten10.
Wenn in den folgenden Kapiteln wiederholt von ‚Referenzgrammatiken des Portugiesischen‘ die Sprache ist, sind folgende Grammatiken gemeint: (a) „Gramática da Língua Portuguesa“ von Mateus et al. (72006); (b) „Gramática do Português“ (Vol. I und II) von Raposo et al. (2013), (c) die „Portugiesische Grammatik“ von Hundertmark-Santos Martins (32014) und (d) die „Nova Gramática do Português Contemporânea“ von Celso Cunha und Lindley Cintra (172002). Die bibliographischen Angaben werden nicht bei jeder Erwähnung dieser Referenz explizit aufgeführt, finden sich aber noch einmal ausführlich in den „Bibliographischen Hinweisen“ am Ende des Buches.
Einfache deutsche Anführungszeichen ‚ ‘ werden zur Hervorhebung bestimmter Schlüsselworte der vorliegenden Arbeit benutzt, wie z.B. des Begriffs ‚O-SK-ST‘ oder bei aufeinanderfolgenden Wörtern, die sich dadurch von ihrem Umgebungstext unterscheiden, dass sie eine begriffliche Einheit darstellen, wie z.B. ‚Sprecher 4‘. Solche Ausdrücke kann man als zusammengehörige Wortgruppen auffassen, ohne dass es sich hierbei um Zitate im engeren Sinne des Wortes handelt. Auch sehr oft wiederholte Fachtermini und Begriffe, deren Quelle bereits vorher angegeben wurde, stehen in einfachen Anführungstrichen.
Kursivschrift wird ausschließlich zur Kennzeichnung portugiesischer Texte genutzt – also zur Kennzeichnung der Objektsprache der Arbeit –, die in Beispielen und Zitaten vorkommen.
Für die Gliederung des Textes werden arabische Zahlen in der Form 1. 2. 3. 3.1 (ohne Punkt hinter der letzten Zahl) benutzt; im Fließtext dienen hingegen in Klammern gesetzte Buchstaben (a), (b), (c), etc. einer erforderlichen Textgliederung.
Durch Unterstreichungen werden nur Wörter oder Wortgruppen aus den Beispielsätzen (Transkriptionen) hervorgehoben, die bei den anschließenden Interpretationen thematisiert werden.
Wenn ein Zitat mindestens drei oder mehr Zeilen umfasst, wird es aus dem Fließtext hervorgehoben und durch einen größeren Abstand zu beiden Seitenrändern sowie einen engerem Zeilenabstand gekennzeichnet. In diesem Falle werden die Zitate nicht in Anführungszeichen gesetzt.
Abkürzungen oder grobe orthographische (authentische) Schnitzer, die insbesondere in den kommunikativen Praktiken der ‚keyboard-to-screen communication‘ das Verständnis erschweren, wurden nur in den Fällen verbessert, in denen die entsprechenden Ausdrücke unleserlich oder zweideutig sind. Ansonsten werden Wortspielereien und graphostilistische Abweichungen von den üblich geltenden Normen des schriftsprachlichen Ausdrucks in ihrer originalen Form belassen.
Die Namen der Gesprächsteilnehmer an kommunikativen Praktiken der ‚keyboard-to-screen communication‘ werden durch die ‚groß‘ und in ‚Fettdruck‘ geschriebenen Anfangsbuchstaben dieser ‚User-Namen‘ abgekürzt, um ihre Anonymität zu gewährleisten.
Um die Leserlichkeit des Fließtextes nicht durch die Angaben umfangreicher Quellen aus dem Internet zu beeinträchtigen, werden die entsprechenden URL jeweils in Fußnoten angegeben. Im Fließtext verbleiben als Referenz nur passende Schlüsselwörter – z.B. mediensprache.net –, die dem Leser einen ersten Hinweis auf die Quelle liefern.
Den Regeln der CLUL zufolge werden alle Wörter sowie ihre entsprechenden Varianten transkribiert, wenn sie als Lemmata in einem portugiesischen Wörterbuch registriert sind (z.B. mostrar/amostrar, louça/loiça, cacatua/catatua).
Den Regeln der CLUL zufolge werden Eigennamen in den Transkriptionen groß geschrieben.
Den Regeln der CLUL zufolge werden Namen von Filmen, Büchern, Zeitungen und Zeitschriften, Fernseh- und Radioprogrammen, Musikbands, Musiktitel etc. klein geschrieben und in Anführungsstriche gesetzt, wie z.B. „crónica dos bons malandros“, „pixote“, „requiem“, „expresso“, „feira franca“, „big brother“ etc.
Den Regeln der CLUL zufolge werden Fremdwörter den orthographischen Regeln ihrer Herkunftssprachen entsprechend wiedergegeben. Diese Regelung betrifft allerdings nur die Fälle, in denen ihre Aussprache der Originalaussprache annähernd entspricht (ex. cachet, feeling, free-lancer, stress, voyeurs, workshop). Wenn es sich hingegen um Lehnwörter handelt, die sich weitgehend der portugiesischen Aussprache angepasst haben, werden diese Wörter so geschrieben, wie sie in den einschlägigen portugiesischen Wörterbüchern verzeichnet sind, wie z.B. shortezinho, stressado, videozinho etc.
Den Regeln der CLUL zufolge werden sowohl die zunächst falsch ausgesprochenen als auch die nachträglich korrigierten Wörter transkribiert, wie z.B. lugal/lugar, sau/céu etc. In den Fällen hingegen, in denen ein Sprecher ein falsch ausgesprochenes Wort nicht nachträglich verbessert und seine Äußerung fortsetzt, wird ausschließlich die korrekte Form transkribiert.
Den Regeln der CLUL zufolge werden Onomatopoeia und parasprachliche Elemente, die sich nicht in einem Wörterbuch finden, in den Transkriptionen so wiedergegeben, dass sie sich so weit wie möglich der Aussprache der Sprachaufnahmen annähern, wie z.B. pac-pac-pac, pffff, tanana, tatata, uuu etc.
Den Regeln der CLUL zufolge werden Interjektionen den gültigen lexikographischen Regeln entsprechend transkribiert.
Den Regeln der CLUL zufolge werden Akronyme und Abkürzungen in Großbuchstaben und ohne zwischengestellte Punkte wiedergegeben (z.B. TAP statt T.A.P.). Wenn aber die entsprechenden Akronyme bereits in einem portugiesischen Wörterbuch registriert sind, werden sie kleingeschrieben, wie z.B. sida oder radar.
Den Regeln der CLUL zufolge werden alle nicht standardsprachlichen oder von der Gewährsperson erfundenen Ausdrücke so transkribiert, dass sie sich so weit wie möglich der Aussprache dieser Gewährspersonen anpassen. Für die Leser dieses Buches habe ich entsprechende Verständnishilfen in Fußnoten beigefügt, sollte zu erwarten sein, dass Leser diese Ausdrücke nicht verstehen.
Den Regeln der CLUL zufolge werden durch die Gewährspersonen abgekürzte Wörter in dieser Form beibehalten, wie z.B. Prof.
Den Regeln der CLUL zufolge werden alle Zahlen einschließlich Kalenderdaten und in Prozentangaben enthaltene Zahlen bis einschließlich der Zahl ‚zwölf‘ ausgeschrieben.
Im Buch benutzte Abkürzungen:
GSF | Gesprochene-Sprache-Forschung: Gemeint ist die in den 70er Jahren in der germanistischen Sprachwissenschaft entstandene Forschungsrichtung, die zusammen und in gegenseitiger Ergänzung mit der ‚Gesprächsanalyse‘ der ‚Interaktionalen Linguistik‘ und der ‚Construction Grammar‘ Erscheinungen des mündlichen Gebrauchs des verbalen Codes bzw. des Nähesprechens untersucht. |
GS | Gesprochene Sprache |
GSFP | Diese Abkürzung bezeichnet die Gesprochene-Sprache-Forschung des Portugiesischen. |
IDS | Abkürzung für Institut für Deutsche Sprache |
m.E. | meines Erachtens |
O-SK-ST | Operator -Skopus-Struktur |
FLUL | Faculdade de Letras de Lisboa |
UL | Universidade de Lisboa |
CLUL | Centro de Linguística da Universidade de Lisboa |