Читать книгу Autochthone Minderheiten und Migrant*innen - Sarah Oberbichler - Страница 28

2. Das Korpus – 20.000 Artikel und Leserbriefe 2.1 Das Korpus

Оглавление

Das Korpus Migration und Südtirol umfasst insgesamt 20.788 ausgewählte und digitalisierte Zeitungsartikel (Berichte, Meldungen, Interviews, Kommentare, Leserbriefe etc.) zum Thema Migration und Südtirol. Grundlage für das Medienkorpus bilden die zwei auflagenstärksten Tageszeitungen Südtirols, die italienischsprachige Alto Adige und die deutschsprachige Dolomiten, von 1990 bis 2014/15. Beide Tageszeitungen erscheinen täglich und umfassen durchschnittlich 7.000 (Dolomiten) und 14.000 (Alto Adige) Seiten pro Monat. Für die Erstellung eines für die Beantwortung der Forschungsfragen angemessenen Korpus und zur Eingrenzung des schieren Umfangs an Nachrichtenmeldungen wurde lediglich die regionale Berichterstattung beider Tageszeitungen berücksichtigt und nach Stichworten durchsucht.

Das Korpus liegt in digitalisierter Form vor und setzt sich aus eingescannten PDF-Dateien oder bereits in Textdateien umgewandelte Ausgaben der Tageszeitungen zusammen. Längst digitalisierte Bestände (PDF-Dateien mit Texterkennung) der Alto Adige stehen in der Stadtbibliothek Bozen in Form von CDs zur Verfügung, dieser Bestand deckt die Jahre 1990 bis 1999 ab. Die Jahrgänge 2000 bis 2003 wurden von der Verfasserin in den Räumlichkeiten der Landesbibliothek Dr. Friedrich Teßmann in Bozen digitalisiert. Und die Jahrgänge 2004 bis 2015 konnten dem Online-Archiv209 der Alto Adige entnommen werden. Dieses Online-Archiv stellt Textdateien sowie PDF-Ausgaben der Tageszeitung kostenpflichtig zur Verfügung.

Textdateien der Dolomiten können nach persönlicher Absprache vom Dolomiten-Archiv der Athesia AG kostenpflichtig erworben werden. Das Dolomiten-Archiv der Athesia archiviert die Dolomiten seit 1991. Der Jahrgang 1990 wurde von der Verfasserin selbst digitalisiert. Die eingescannten PDF-Seiten wurden mittels Texterkennung in maschinenlesbare PDFs – nicht in XML-Dateien – umgewandelt und somit für die weitere computerbasierte Auswertung aufbereitet.

Obwohl die Qualität der Scans sehr gut ist, treten Fehler bei der Texterkennung auf. Unebenheiten in der Zeitung und unterschiedliche Schriftbilder verursachen durchschnittlich fünf bis zehn Fehler pro Seite. Für Positiv-Suchen – wie es in dieser Arbeit der Fall ist – stellt dies kein größeres Problem dar. Bereits 80 Prozent Buchstabengenauigkeit reichen aus – so auch Konstantin Baierer und Philipp Zumstein –, um aussagekräftige Ergebnisse zu erlangen.210 Bei Zeitungen aus dem 21. Jahrhundert und qualitativ hochwertigen Scans liegt die Buchstabengenauigkeit zudem weit über 80 Prozent. Darüber hinaus muss bedacht werden, dass die computergestützte Volltextsuche weitaus mehr Resultate liefert als das händische Durchblättern der Zeitungen. Obwohl bei einer Buchstabengenauigkeit von 90 bis 99 Prozent selbstverständlich einzelne Inhalte unentdeckt bleiben, steht dies in keiner Relation zur Ungenauigkeit der manuellen Suche.211 Der Verzicht auf eine computergestützte und komplexe Volltextsuche hätte die Zahl der gefundenen Artikel deutlich eingeschränkt. Allzu häufig verbergen sich wichtige Aussagen gerade dort, wo Überschriften nicht explizit auf das Thema Migration hinweisen. Auch wäre es im vorgegebenen Zeitrahmen nicht möglich gewesen, ein derart großes Korpus auf jede einzelne Überschrift, geschweige denn jedes einzelne Wort zu durchsuchen. Aus diesem Grund ist selbst eine leicht fehlerhafte computergestützte Volltextsuche effektiver als das eigenständige Durchsuchen von Zeitungen und hat somit seine Berechtigung.


Grafik 1: Frequenzanalyse aller Zeitungsartikel des Korpus Migration und Südtirol

Die Anzahl der in den beiden Tageszeitungen gefundenen Artikel ist beträchtlich. Insgesamt 10.065 wurden im Zeitraum von 1990 bis 2014/15 der Dolomiten entnommen und 10.723 der Alto Adige. Für die deutschsprachige Dolomiten wurden folgende Suchbegriffe herangezogen:

Nicht-EU-Bürger*, Nicht-EG-Bürger*, Zuwander*, Zugewanderte*, Saisonkräfte*, Saisonarbeitskräfte*, ausländisch*, *migra*, Einwander*, Ausländer*, Gastarbeiter*, Saisonarbeiter*, Fremdarbeiter*, Fremde, Flüchtling* (asylant*, asylberechtigt*, asylsuchend*, Asylwerber*, Asylbewerber*).

Für die italienischsprachige Alto Adige:

extracomunitar*, migra*, stranier*, lavorator* stagional*, profugh* (rifugiat*, fuggiasc*, fuggitiv*, asilo politico, richiedenti asilo).

Das Resultat der Stichwortsuche ist ein individuell zusammengestelltes Korpus mit individuell gewählten Stichworten. Die Keywords wurden speziell für die Beantwortung der Forschungsfragen gewählt. Bewusst wurde dabei auch auf Begriffe wie Illegale oder clandestini verzichtet, da sie stets in Zusammenhang mit den bereits oben aufgeführten Begriffen vorkamen. Grafik 1 zeigt die absolute Frequenz der entnommenen Zeitungsartikel beider Tageszeitungen zwischen 1990 und 2014.

Nicht jeder Artikel, der die oben genannte Stichworte enthielt, wurde in das Subkorpus aufgenommen. Kamen Stichworte ohne weitere Thematisierung und Kontextualisierung vor, hat dies zum Ausschluss jener Artikel geführt. Es handelt sich hierbei um durchschnittlich 20 Prozent der vorgefundenen Artikel, die für die Beantwortung der Forschungsfragen als nicht relevant angesehen wurden. Fraglos hätte die Wahl anderer Stichworte zu unterschiedlichen Ergebnissen geführt. So wurde beispielsweise bewusst nicht nach Nationalitäten oder Herkunftsländern gefragt. Eine möglichst vollständige Suche wäre nur unter extrem hohem Zeitaufwand möglich gewesen und die Konzentration auf einige wenige Nationalitäten oder Länder hätte zu einer selektiven Auswahl und somit Verzerrung der Ergebnisse geführt.

Autochthone Minderheiten und Migrant*innen

Подняться наверх