Читать книгу Когнитивные механизмы невербальной коммуникации - В. А. Барабанщиков - Страница 16
Глава 2. Зависимость восприятия лицевых экспрессий от пространственно-временной структуры экспозиции
2.1. Динамика выражений лица как источник информации о модальности эмоции
ОглавлениеХотя эмоции человека всегда развернуты во времени, т. е. имеют начало, кульминацию и конец, их восприятие сторонним наблюдателем традиционно изучается на материале дискретных экспозиций, фиксирующих состояния людей в определенный момент времени (фотографий, портретов, рисунков). Изображенные позы, жесты, выражения лица действительно характеризуют модальность и интенсивность переживаний личности, но вне динамики являются скорее символами соответствующих эмоций. Подобный подход оправдывается скоротечностью экспрессий и категориальностью самого восприятия (Ананьева, Барабанщиков, Демидов, 2015; Барабанщиков, Демидов, Дивеев, 2012; Барабанщиков, Жегалло, Королькова, 2016; Calder, Rhodes, Johnson, Haxby, 2011; Ekman, Rosenberg, 2005).
Немногочисленные работы по восприятию динамики выражений лица опираются на идеи экологической оптики (Gibson, 1966; McArthur, Baron, 1983) и вытекающие из них исследования восприятия биологического движения (Johansson, 1973). Ключевой факт состоит в том, что в отсутствие структурированных поверхностей кинематические паттерны, сопровождающие любое естественное поведение, способны нести уникальную информацию о содержании (но прежде всего о форме) воспринимаемого объекта. В частности, в темноте движение 10–12 светящихся точек, установленных на основных сочленениях тела натурщика, вызывает впечатление локомоций определенного человека, позволяет определить их тип (прогулка, бег, прыжки) и гендерную стилистику. При остановке движения перцептивный эффект исчезает, а с началом движения – проявляется через 100 мс (Cutting, Kozlowski, 1977; Runeson, Frykholm, 1983). Использование метода световых точек при изучении восприятия выражений лица показало, что во время их движения наблюдатели точно оценивают модальность экспрессии невидимого натурщика, но идентифицировать статичный набор точек в качестве лица человека и/или его эмоции не в состоянии (Bassili, 1978). При перемещении световых точек существует высокая вероятность опознавания лиц известных наблюдателю людей и определения их пола (Bruce, Valentine, 1988). Важность информации о динамике лица была продемонстрирована в экспериментах другого типа. Например, Б. Найт и Х. Джонстон нашли, что известные лица лучше идентифицируются на фотонегативах, если последние экспонируются не статично, а в движении (Knight, Johnston, 1997).
Использование методов компьютерной анимации, получивших распространение в последние годы, подтвердило влияние динамики лица на точность распознавания эмоциональных экспрессий (Wallraven, Breidt, Cunningham, Bülthoff, 2008; Wehrle, Kaiser, Schmidt, Scherer, 2000), особенно в условиях ограничения статичной информации – при исключении из экспозиции текстуры и контура лица, его схематизации и т. п. Так, при постепенном уменьшении информации о текстуре или строении лица точность оценок статических экспрессий резко снижается, тогда как при значительной потере информации и «смазывании» изображений лица динамические экспрессии распознаются эффективно (Wallraven et al., 2008). Снижая уровень детализации (количество опорных точек) либо уменьшая размер изображений анимированных экспрессий, можно добиться большего эффекта динамики по сравнению со статикой, независимо от наличия текстуры (Cunningham, Wallraven, 2009a, 2009b).
С усилением экологической валидности условий восприятия, в том числе при экспозиции естественных изображений лица, эффект движения уменьшается либо не проявляется вовсе (Cunningham, Wallraven, 2009a; Fiorentini, Viviani, 2011; Fiorentini, Schmidt, Viviani, 2012; Katsyri, Sams, 2008). Экспонируя динамические последовательности, полученные путем покадрового компьютерного морфинга пар видеофрагментов «нейтральное лицо – сильно выраженная экспрессия», К. Фиорентини и П. Вивиани не выявили систематических различий при категоризации статических либо динамических переходных экспрессий (Fiorentini, Viviani, 2011). Уменьшение угловых размеров видеоизображений экспрессий вплоть до 2° также не приводит к сильному ухудшению их различения (Cunningham et al., 2004). При сопоставлении результатов распознавания базовых динамических экспрессий по их видеоизображениям на лице натурщика и компьютерным реконструкциям высокой степени детализации и реалистичности (в частности, 3D- и 4D-сканирование лица) наблюдаются сходные уровни точности идентификации (Cunningham et al., 2004; Wallraven et al., 2008). Однако при сравнении динамических экспрессий, выраженных натурщиком, и компьютерной 3D-анимации более низкого качества, которая не полностью передает детали реального лица и затрудняет распознавание статических экспрессий, динамика обеспечивает более высокую эффективность восприятия (Katsyri, Sams, 2008).
Важными для понимания эффекта движения лица представляются следующие обстоятельства.
Во-первых, динамика мимических проявлений несет функционально иной тип информации по сравнению со статичными признаками эмоции. Во всяком случае, ее влияние нельзя полностью объяснить множественным суммированием статичных образов. В частности, в условиях динамической экспозиции слабовыраженные экспрессии распознаются более точно, чем дискретные «срезы» этих же экспрессий, разделенные масками, исключающими появление кажущегося (стробоскопического) движения и порождающими эффект «слепоты к изменению» (Ambadar, Schooler, Cohn, 2005). Преимущество динамических экспозиций не исчезает и при пространственной инверсии лица, расшатывающей его конфигурационные связи, по крайней мере, для части экспрессий (Ambadar, Schooler, Cohn, 2005; Bould, Morris, Wink, 2008).
Во-вторых, эффект движения лица зависит от интенсивности экспрессий. Чем слабее выражена эмоция, тем больший вклад в ее распознавание вносит динамическая составляющая (Bould, Morris, 2008; Bould, Morris, Wink, 2008). При сильных мимических проявлениях информация, достаточная для точной идентификации модальности эмоций, содержится уже в статичных экспозициях лица, а эффект динамики (более слабый) наблюдается только для экспрессий гнева, отвращения, радости и удивления.
В-третьих, влияние непрерывных мимических изменений на восприятие выражения лица вызвано не самим фактом движения, а его временной структурой. При ее разрушении или инверсии точность распознавания модальности слабых динамических экспрессий падает (Cunningham, Wallraven, 2009a). Изменение характерной скорости проявления слабо выраженных экспрессий ведет к ухудшению их распознавания (Bould, Morris, Wink, 2008). Установление механизмов, чувствительных к временной структуре экспрессий, составляет одну из наиболее важных перспектив исследования восприятия естественных выражений лица в экологически валидных условиях.
Впечатление непрерывного изменения лица может быть получено не только в результате реальной динамики мимических мышц, но и иным путем. Например, быстрой сменой экспозиций статичных «срезов» экспрессивной динамики. Именно на этом принципе построен кинематограф. Сохранятся ли тенденции, описанные выше, при восприятии кажущегося движения лица?
Под кажущимся (стробоскопическим) движением мы будем понимать последовательность статичных изображений экспрессий, вызывающую впечатление непрерывного изменения эмоционального состояния натурщика. Целесообразность обращения к ситуации кажущегося движения при изучении восприятия экспрессий лица состоит в том, что здесь реализуется простейшая временная структура динамической экспозиции и моделируется преобразование одного статичного состояния в другое, подобное линейному пространственному морфингу лица (Барабанщиков, Жегалло, Королькова, 2016; Куракова, 2013; Жегалло, 2007; Calder et al., 1996; De Gelder, Teunisse, Benson, 1997). В рамках проблемы восприятия выражений лица возникают следующие вопросы. Влияет ли стробоскопическая экспозиция экспрессий на точность их распознавания? Если влияет, то как? Какие ошибки совершают наблюдатели? Зависит ли результат распознавания от модальности и продолжительности экспрессий? К сожалению, прямые исследования восприятия стробоскопической экспозиции выражений лица отсутствуют. Существуют данные, подчеркивающие сходство восприятия кажущегося и реального движения и их зависимость от одних и тех же детерминант (Марр, 1987; Ульман, 1983; Bruce, Green, 1993; Clatworthy, Frisby, 1973; Kolers, 1972), среди которых особый интерес представляет эффект повышения различительной чувствительности отрезков прямых при их периодичной стробоскопической экспозиции, вызывающей впечатление кажущегося движения (Джафаров, Аллик, Линде, 1983; Линде, Соколов, 1986; Соколов, 1986).
Отвечая на поставленные вопросы, мы провели ряд экспериментов, в которых исследовалась зависимость распознавания базовых эмоциональных экспрессий от условий их экспозиции. Точность восприятия эмоций оценивалась в ситуациях (1) стробоскопического движения, (2) прямой и обратной зрительной маскировки и (3) статической экспозиции фотоизображений лицевых экспрессий на пустом экране. В условиях стробоскопического движения на короткое время экспонировалась статическая экспрессия, до и после которой в этой же позиции предъявлялись изображения спокойного лица. В условиях зрительной маскировки спокойное лицо заменялось «маской», созданной путем случайного перемешивания частей спокойного лица; возникновение эффекта движения в этом случае не ожидалось. Наконец, в контрольной серии фотографии эмоционального лица предъявлялись сами по себе без каких-либо дополнительных изображений.
Согласно гипотезе, при быстром предъявлении наблюдателям последовательности статичных изображений «нейтральное лицо-экспрессия – нейтральное лицо» возникает впечатление динамической микроэкспрессии, длящейся доли секунды. По сравнению со статичными «срезами» лица и/или с изображениями, подверженными маскировке, распознавание эмоций в условиях кажущегося движения может быть более эффективным.