Читать книгу Kognitive Psychologie - Tilo Strobach - Страница 27

2.3.3 Gesichtserkennung

Оглавление

In Marrs Algorithmischem Ansatz, in der Merkmalsanalyse und in Biedermans Recognition-by-components-Theorie werden die Komponenten, Einzelmerkmale oder Geons bei der Objekterkennung hervorgehoben. Diese Ansätze lassen aber offen, ob die Bedeutsamkeit dieser Elemente in gleichem Maße für alle Objekte in der Erkennung gelten, ob sich diese Bedeutsamkeit mit Erfahrung verändern kann und welche alternativen Informationen bei der Objekterkennung herangezogen werden könnten.

Eine besondere Klasse von Objekten im Bereich der Objekterkennung sind menschliche Gesichter. Auf einer beschreibenden Ebene kann die besondere Stellung von Gesichtern gezeigt werden, wenn man folgende Eigenschaften der Gesichtserkennung betrachtet: Es ist relativ zuverlässig, dass aus Gesichtern eine große Menge von Personeninformationen gezogen werden können, wie Geschlecht, Alter, ethnische Zugehörigkeit, emotionaler Zustand und gesundheitlicher Status (Bruce & Young, 1986; Calder, Rhodes, Johnson & Haxby, 2011). Außerdem kann eine relativ große Anzahl von Gesichtern identifiziert werden, trotz einer hohen strukturellen Ähnlichkeit zwischen den verschiedenen Gesichtern (d. h. alle Gesichter kombinieren die Elemente Auge, Nase, Mund etc. in gleicher räumlicher Weise). Die Frage bleibt aber offen, ob Gesichter auf besondere Weise wahrgenommen und erkannt werden. Das Phänomen der Prosopagnosie ist ein erster Befund, der für eine Besonderheit von Gesichtern in der Objekterkennung spricht (Damasio, Damasio, & Van Hoesen, 1982; McNeil & Warrington, 1993). Prosopagnosie tritt durch bestimmte Hirnschädigungen auf und geht mit dem selektiven Verlust der Fähigkeit der Gesichtserkennung und genauer der Gesichtsidentifikation einher. Das Erkennen anderer Objektklassen ist weitgehend ungestört. Des Weiteren zeigt sich bei verschiedenen Aufgaben in bildgebenden Verfahren in Personen ohne Prosopagnosie, dass eine erhöhte Aktivität und ein spezifisches Aktivierungsmuster im Gyrus fusiformis ( Kap. 2.1.3) im inferioren Temporallappen beim Erkennen von Gesichtern im Vergleich zu anderen Objektklassen (z. B. Häuser) zu finden ist (Haxby et al., 2001).

Eine weitere Besonderheit der Gesichtserkennung deutete sich bereits in den ersten experimentellen Studien an. Die Identifikation von Gesichtern ist besonders in einer aufrechten Orientierung genau. Diese Genauigkeit wird allerdings deutlich reduziert, wenn Gesichter in einer weniger typischen, invertierten Orientierung (»auf dem Kopf stehend«) präsentiert werden. Diese Reduktion (d. h. Inversionseffekt) kann man in dieser Ausprägung nicht in anderen Objektklassen finden (Yin, 1969). Um zu untersuchen, welche Arten von Informationen beim Erkennen von aufrechten Gesichtern von Bedeutung sind und der Verlust welcher Informationsart bei Inversion eines Gesichts zum Inversionseffekt und damit zur schwierigeren Erkennung von Gesichtern führt, wurden neben Einzelkomponenten ( Abb. 2.10; A) vor allem die Bedeutsamkeit von konfiguralen Informationen untersucht ( Abb. 2.10; B). Einzelkomponenten in Gesichtern sind beispielsweise Auge, Nase und Mund und die konfiguralen Informationen repräsentieren die räumlichen Relationen zwischen diesen Einzelkomponenten (z. B. liegen die Augen oberhalb der Nase; Abstand zwischen den Augen; Maurer, Le Grand, & Mondloch, 2002). Die Identifikation von Gesichtern in aufrechter und invertierter Orientierung wurde anhand von Gesichtern untersucht, die entweder auf Basis der Farbe, der Einzelkomponenten oder der Konfigurationen (d. h. Auge-Mund-Abstand) erkannt werden konnten (Leder & Bruce, 2000). Die Leistung in der Identifikation zeigte kaum einen Inversionseffekt, wenn die Identifikation aufgrund der Farbe von Einzelkomponenten möglich war, somit scheinen Informationen aus Gesichtskomponenten unabhängig von ihrer Orientierung zu sein. Allerdings wurde die Identifikation in der invertierten im Vergleich zur aufrechten Bedingung beeinträchtigt, wenn die Identifikation von Gesichtern aufgrund der konfiguralen Information möglich war. Dieser Inversionseffekt demonstriert, dass konfigurale Informationen essentiell für die Erkennung von Gesichtern in ihrer typischen aufrechten Orientierung sind. In der invertierten Bedingung sind diese Informationen nicht mehr erkennbar und damit sind die Gesichter schlechter zu identifizieren. Aus dieser Beeinträchtigung in der Verarbeitung konfiguraler Informationen ist somit auch die Bedeutsamkeit des Inversionseffekts in Gesichtern im Vergleich zu anderen Objektklassen zu erklären (Yin, 1969).


Abb. 2.10: Illustrationen von Informationen in Gesichtern. (A) Beispiel für Informationen aus Einzelkomponenten, (B) Beispiel für konfigurale Informationen, (C) holistische Informationen ohne klare Details

Neben konfiguralen Informationen in Gesichtern wird in der Literatur die Bedeutsamkeit von holistischen Informationen für die Erkennung von Gesichtern diskutiert. Ein holistischer Verarbeitungsmodus ermöglicht das Erkennen bestimmter Objekte als undifferenzierte Ganzheit (vergleichbar mit der Gestaltpsychologie, Kap. 2.2.2). Damit werden die Objekte nicht durch Analyse der Komponenten in diesem Verarbeitungsmodus erkannt, wie das in Marrs Algorithmischem Ansatz oder Biedermans Recognition-by-components-Theorie der Fall ist. Vorstellbar wird holistisches Erkennen beim Identifizieren von Gesichtern aus großen Entfernungen, aus denen Einzelkomponenten weniger scharf erkannt werden können. Das Erkennen beruht hier eher auf der Gesamtheit der erkannten Informationen. Illustriert wird das holistische Erkennen in Abbildung 2.10 C, in der eher ganzheitliche Informationen anstatt Einzelkomponenten erkennbar sind ( Abb. 2.10; C). Hinweise darauf, dass die Erkennung von Gesichtern in besonders holistischer Weise erfolgt, stammen aus verschiedenen Untersuchungsparadigmen. Zum Beispiel haben Versuchspersonen in einer Studie von Tanaka und Farah (1993) Darstellungen von Gesichtern und Häusern gelernt (z. B. »Das ist das Gesicht von Larry.«, »Das ist das Haus von Joe.«). In einem anschließenden Test wurde ihnen dann entweder die zuvor gelernten Reize zum Erkennen präsentiert (z. B. »Ist das das Gesicht von Larry?«, »Ist das das Haus von Joe?«) oder es wurden isolierte Komponenten der gelernten Reize präsentiert (z. B. »Ist das die Nase von Larry?«, »Ist das die Tür von Joes Haus?«). Im Vergleich mit der Leistung der gelernten Reize zeigte sich eine Beeinträchtigung des Erkennens der Einzelkomponenten lediglich bei den Gesichtern, aber nicht bei den Häusern. Dieses Ergebnis zeigt die besondere Abhängigkeit des Erkennens einzelner Gesichtskomponenten von der holistischen Ganzheit des Gesichts.

Wir haben nun gesehen, dass das Erkennen von Gesichtern nicht nur auf Basis von Einzelkomponenten, sondern auch durch Verarbeitung von konfiguralen und holistischen Informationen erfolgt. Außerdem zeigen sich im Gyrus fusiformis besondere neuronale Aktivitätsstärken und -muster bei der Gesichtserkennung. Ausführlich diskutiert wurde allerdings die Frage, wie spezifisch sind diese Besonderheiten für Gesichter beziehungsweise lassen sich diese Besonderheiten auch in anderen Objektklassen wiederfinden. Als ein gemeinsames entscheidendes Kriterium über verschiedene Objektklassen hinweg wurde eine ausgesprochene Expertise für die betrachtenden Personen diskutiert. Beispielsweise zeigte sich eine vergleichbare Aktivitätserhöhung im Gyrus fusiformis auch bei Experten für Autos, Vögel oder Schachpositionen, wenn ihnen entsprechende Reize präsentiert werden (Bilalić, 2016; Gauthier, Skudlarski, Gore & Anderson, 2000). Konsistent mit diesen Befunden zeigt sich, dass mit extensivem Training beim Erkennen von Fantasiefiguren (sogenannten Greebles) eine stärkere Aktivierung des Gyrus fusiformis als beim Erkennen von Gesichtern erreicht werden kann (Gauthier, Tarr, Anderson, Skudlarski & Gore, 1999). Des Weiteren zeigt sich ein ähnlicher Inversionseffekt beim Erkennen von Gesichtern von Menschen und Hunden bei Hundeexperten (Diamond & Carey, 1986). Ein Inversionseffekt dieser Art tritt bei Personen ohne »Hunde«-Expertise ausschließlich bei menschlicher Gesichtserkennung, aber nicht bei Gesichtserkennung von Hunden auf. Zusammenfassend sind die Phänomene im Bereich der Gesichtserkennung (z. B. Inversionseffekt, Aktivität im Gyrus fusiformis) also nicht auf die spezifischen Objekte beziehungsweise Gesichter zurückzuführen, sondern sie sind generalisierbar auf Objektklassen, in den Personen eine außergewöhnliche Erfahrung und Leistung (d. h. Expertise) besitzen.

Schon im Bereich der neuronalen Verschaltung auf frühen Ebenen der visuellen Verarbeitung haben wir gesehen, dass es wechselseitige neuronale Verbindungen zwischen Strukturen gibt, die im Laufe der visuellen Verarbeitung früher rekrutiert werden und es gibt Strukturen, die später rekrutiert werden (beschrieben wurden bereits die wechselseitigen Verbindungen zwischen den Neuronen auf den Sehbahnen und dem primären visuellen Kortex). Allerdings sind solche wechselseitigen Verbindungen nicht nur auf relativ frühen und basalen Ebenen der Verarbeitung zu finden, sondern es gibt auch im Kontext der Objekterkennung Beispiele von wechselseitigen Verbindungen zwischen unterschiedlichen neuronalen Strukturen und kognitiven Komponenten. Evidenz für diese Wechselseitigkeit zeigt sich in sogenannten Adaptationseffekten der visuellen Objektwahrnehmung auf Gedächtnisrepräsentationen dieser Objekte. Ein früher Befund solcher Adaptationseffekte zeigt, dass (1) das Betrachten einer horizontalen (Adaptations-)Ellipse zum subjektiven Eindruck einer vertikalen Ellipse führt, wenn nachfolgend ein (Test-)Kreis präsentiert wird. (2) Das Betrachten einer linksorientierten (Adaptations-)Linie führt dagegen zum subjektiven Eindruck einer rechtsorientierten Linie, wenn nachfolgend eine vertikale (Test-)Linie präsentiert wird ( Abb. 2.11; Köhler & Wallach, 1944). Allerdings gibt es neuere Befunde, die solche Adaptationseffekte von einfachen auf komplexere Formen übertragen konnten:

1. Betrachten Versuchspersonen bekannte Gesichter mit stark reduzierten Auge-Mund-Abständen, dann werden nachfolgend nicht veränderte Gesichter als Gesichter mit erweiterten Auge-Mund-Abständen eingeschätzt ( Abb. 2.11; der umgekehrte Fall nach Adaptation mit stark erweiterten Auge-Mund-Abständen ist analog).

2. Betrachten Versuchspersonen ältere Gesichter, dann werden nachfolgend neutrale Gesichter als jüngere Gesichter eingeschätzt (auch hier ist ebenfalls der umgekehrte Fall nach Adaptation mit jüngeren Gesichtern möglich; Strobach & Carbon, 2013; Webster & MacLeod, 2011).

Obwohl in allen Fällen von Adaptationseffekten in einfachen und komplexen Objekten der Adaptationseffekt im Testbild nicht dasselbe Ausmaß erreicht wie im Adaptationsbild, zeigen solche Effekte, dass Wahrnehmungen nicht nur von Objektrepräsentationen beeinflusst werden. Diese Befunde zeigen auch, dass sich Objektrepräsentationen flexibel an veränderte Wahrnehmungseindrücke in der sich dynamisch verändernden Umwelt adaptieren können.


Abb. 2.11: Illustrationen von Adaptationsbildern, Testbildern und den resultierenden Adaptationseffekten am Beispiel der Form und Orientierung einfacher Objekte (erste Zeile) und konfiguralen Informationen in komplexen Objekten (d. h. bekannten Gesichtern; zweite Zeile)

Kognitive Psychologie

Подняться наверх