Читать книгу Korpusgestützte Textanalyse - Manfred Stede - Страница 8
1.3 Das Potsdamer Kommentarkorpus
ОглавлениеIn der Entstehungszeit von ANNIS wurde auch das ‚Potsdamer Kommentarkorpus‘ (PCC) als exemplarisches Korpus für die Mehrebenen-Annotation entwickelt (Stede, 2004). Es besteht aus 174 Texten aus der Märkischen Allgemeinen Zeitung (MAZ), die ursprünglich auf den Ebenen Satzsyntax, nomnale Koreferenz und Rhetorische Struktur annotiert wurden. In der aktuellen Version PCC 2.01 (Stede u. Neumann, 2014) sind Konnektoren und ihre Argumente hinzugekommen. Die der Annotation zugrunde liegenden Richtlinien sind in dem online frei zugänglichen Band (Stede, 2016a) zusammengefasst. Alle Texte stammen von den Kommentarseiten der MAZ aus den frühen 00er Jahren und sind etwa 12–14 Sätze lang. Das PCC ist in ANNIS3 online verfügbar und kann für Korpusabfragen zu den meisten der in Teil II des Buches diskutierten Annotationsebenen verwendet werden. Eine ausführlichere Darstellung der Hintergründe des Korpus und der zugrunde liegenden Design-Entscheidungen beim PCC findet sich in (Stede, 2016b).