Читать книгу Невербальная коммуникация. Экспериментально-психологические исследования - Владимир Морозов - Страница 12
Раздел 1
Искусство и наука общения: невербальная коммуникация
2 Особенности невербальной коммуникации по сравнению с речью
2.6. Особенности акустических средств передачи (кодирования) невербальной информации
ОглавлениеОсновными акустическими средствами передачи различных видов невербальной информации от говорящего к слушателю являются: а) тембр голоса, физическим эквивалентом которого является спектр звука, т. е. графическое отображение частотного (обертонового) состава голоса, б) мелодика речи (изменение высоты голоса во времени), в) энергетические характеристики (сила голоса и ее изменение), г) темпоритмические особенности речи, д) атипичные индивидуальные особенности произношения (смех, покашливание, заикание и т. п.).
Носителем вербальной фонетической информации является спектр сложного речевого звука, точнее – динамика формантной структуры спектра во времени (Фант, 1964). При этом для речи высота голоса, т. е. частота основного тона, практически не имеет значения[1], поскольку любую речевую информацию можно передать голосом любой частоты в пределах звуковысотного диапазона говорящего. Что же касается невербальных видов информации, то носителем ее наряду со спектром служат и звуковысотные характеристики голоса (мелодика речи, т. е. динамика частоты основного тона). Именно поэтому ограничение спектра высоких частот до 300–200 Гц (т. е. изъятие их из спектра с помощью электроакустических фильтров) приводит к полному разрушению вербальной информации (потере разборчивости речи) при значительной сохранности эмоциональной, индивидуальной и других видов невербальной информации (Морозов, 1989). Указанная особенность невербальной, в частности эмоциональной, информации позволяет моделировать ее средствами инструментальной музыки, голосом певца, поющего одну лишь мелодию на одной гласной (вокализ), и даже частотномодулированным чистым тоном (свистом). Музыкальные категории – минор и мажор – являются следствием этой закономерности.
Рис. 4. Невербальная экстралингвистическая информация голоса оказывается более помехоустойчивой (по сравнению с лингвистической) не только по отношению к действию шума, но и по отношению к частотному ограничению спектра.
График показывает, что ограничение высоких частот до 400 Гц почти полностью разрушает лингвистическую информацию (разборчивость слов падает до 5,5 %), определение же эмоций в таком сигнале, так же как и узнавание диктора, в значительной степени сохраняются, 60 % и 70 % соответственно (Морозов и др., Язык эмоций, мозг и компьютер, 1989).
Высота голоса и ее изменения во времени выступают носителем не только эмоциональной, но и других видов невербальной информации, например возрастной, половой, индивидуально-личностной. Биофизической основой этого является, в частности, обратно пропорциональная зависимость частоты основного тона речи человека от длины и массивности его голосовых складок[2] (Медведев и др., 1959). У женщин и детей, складки которых короче и тоньше, чем у мужчин, высота голоса соответственно выше, примерно на октаву. Этой же закономерностью определяются индивидуальные различия в высоте голоса разных людей: высокие и массивные люди имеют, как правило, более крупную гортань и соответственно более низкие голоса по сравнению с низкорослыми и худыми людьми. Указанные закономерности находят отражение в высоких коэффициентах корреляции между высотой голоса людей, с одной стороны, и их полом, возрастом и весом, с другой стороны.
Наряду с этим установлено, что важнейшим средством психоакустического кодирования невербальной информации является спектр звука, определяющий, как известно, тембр голоса. Интегральный спектр голоса и речи с различным эмоциональным содержанием существенно различаются, особенно в высокочастотных областях спектра (см. рисунок 5). Так, для гнева характерно усиление высоких обертонов, что приводит к увеличению звонкости, «металличности» тембра, а для страха, наоборот, сильное падение высоких обертонов, что делает голос глухим, «тусклым», «сдавленным». Радость приводит к смещению формантных частот в более высокочастотную область, в результате того что человек говорит как бы «на улыбке» (см. рисунок 5 – спектр голоса Ф. Шаляпина при выражении разных эмоций).
Рис. 5. Интегральные спектры голоса Ф. Шаляпина при исполнении им отрывков из вокальных произведений, насыщенных различным эмоциональным содержанием, показывают сильные различия в уровне и частотном положении высоких обертонов голоса при выражении радости, горя, гнева, страха. Эти различия и обусловливают характерные изменения тембра голоса артиста при выражении эмоций.
Эмоционально окрашенные фразы взяты из следующих произведений: гнев – из сцены И. Сусанин в лесу («Табор вражеский заснул. Спите крепко до зари») из оперы «Жизнь за царя». Радость – речитатив Галицкого: «Грешно таить, я скуки не люблю…» из оперы «Князь Игорь». Печаль – «Ах ты, ноченька…» – русская народная песня «Ноченька». Страх – «Вон, вон там! Что это там?! В углу!!! Колышется!..» – сцена из оперы «Борис Годунов» (Морозов, 1989).
При распознавании знакомых и незнакомых людей по звуку их голоса (индивидуально-личностная невербальная информация) испытуемые указывают, что они ориентируются на свойственное разным людям различие в тембрах (т. е. в спектрах) голосов наряду с интонационными и другими особенностями их речи (Пашина, Морозов, 1990). Сила голоса, и в особенности динамика ее изменений во времени, – также важное акустическое средство кодирования невербальной информации. Так, для печали характерна слабая, а для гнева – увеличенная сила голоса и т. п. Изменение силы голоса во времени – весьма информативный показатель: медленные ее нарастания и спады (так же, как и высоты тона) характерны для печали («плачущие интонации»), а резкие взлеты и обрывы – для гнева (с м. рисунок 6).
Рис. 6. Осциллограммы голоса, т. е. графическое изображение динамики звука во времени, показывают, что каждая эмоциональная интонация – радость, горе, безразличие, гнев, страх – выражается своими особыми, характерными для нее акустическими средствами (Морозов, 1989)
Подчеркнем, что именно динамика акустических параметров – важнейшее средство кодирования всех видов речевой информации.
Наконец, существенная роль в кодировании невербальной информации принадлежит темпоритмическим характеристикам речи. Так, одна и та же фраза («Прости, я сам все расскажу…»), произнесенная по просьбе исследователей известным артистом О. Басилашвили с разными эмоциональными оттенками, имела средний темп произнесения (слогов в секунду) при выражении: радости – 5,00, печали – 1,74, гнева – 2,96, страха – 4,45. Аналогичные результаты получены при анализе эмоциональной выразительности вокальной речи.
При исследовании людей разных возрастных групп (биофизическая информация) оказалось, что их средние статистические характеристики темпа речи существенно различаются: в группе молодых людей (17–25 лет) – 3,52 слога в секунду, в группе среднего возраста (38–45 лет) – 3,44, в группе старшего возраста (50–64 года) – 2,85, в группе старческого возраста (75–82 года) – 2,25 слога в секунду. Это вызвано тем, что с возрастом замедляется активность артикуляционного процесса. Коэффициент корреляции между показателями возраста и темпа речи (по группе обследуемых 33 человека) оказался равным R = 0,6134 (при вероятности нуль-гипотезы р = 0,0001).
Иллюстрацией важности ритмической организации речи в передаче эстетической информации может служить ритм стиха. Стихотворный ритм, как известно, отличается от ритма прозы своей упорядоченностью, т. е. равномерным чередованием ударных или безударных слогов (ямб, хорей, дактиль, амфибрахий и др.), а также одинаковым числом слогов в строке. Таким образом, помимо поэтического изящества мысли (метафоричность, лиричность и др.), что достигается вербальными средствами, стихотворный жанр характеризуется и невербальными особенностями – упорядоченной ритмической организацией, и, естественно, рифмой, что достигается фонетическими средствами, т. е. известным подбором благозвучных (сходных по звучанию) фонемных окончаний последних слов в стихотворных строках.
Важнейшая особенность кодирования невербальной информации речи состоит во взаимодействии различных акустических средств, иными словами, любой вид невербальной информации передается, как правило, не каким-либо одним акустическим средством, а одновременно несколькими. Например, информация о разном эмоциональном состоянии говорящего найдет выражение не только в изменении тембра (т. е. спектра) голоса, но и в характерных для каждой эмоции изменениях высоты, силы, темпоритмических характеристик речевой фразы (см. рисунок 6).
Так, эмоция гнева, наряду с общим увеличением силы голоса, приводит также к увеличению высоты голоса, укорочению фронтов нарастания и спада звука, т. е. к увеличению резкости речевых звуков. Эмоция печали, наоборот, характеризуется медленным нарастанием и спадом силы и высоты голоса, увеличенной длительностью слогов, падением силы и звонкости голоса.
Указанные характерные комплексные изменения акустических свойств голоса и речи вызваны соответствующими изменениями общего физиологического состояния человека при разных эмоциях: например, усилением общей нервно-мышечной активности в состоянии гнева или общей нервно-психологической подавленностью и мышечной расслабленностью организма при печали. Это закономерно и отражается на работе органов образования голоса и речи.
Таким образом, различные биофизические характеристики человека (пол, возраст, рост, вес), эмоциональное состояние и другие психологические свойства говорящего закономерно отражаются в акустических особенностях его речи и голоса, а это, в свою очередь, является объективной основой для адекватного субъективного восприятия говорящего слушателем.
1
Следует заметить, что мелодика речи, будучи важнейшим компонентом интонации (последняя реализуется также с участием ударения и темпоритмических характеристик речи), играет немаловажную роль в передаче и смысловых характеристик высказывания (вопрос, утверждение, завершенность, незавершенность) (Зиндер, 1979; Светозарова, 1982; Брызгунова, 1984).
2
Указанное соотношение приблизительно описывается формулой: , где F0 – частота колебаний голосовых складок (Гц), т. е. – частота основного тона, P – величина подсвязочного давления в трахее, C – степень жесткости (или натяжения) голосовых складок, L – длина колеблющейся части, M – колеблющаяся масса, k – коэффициент пропорциональности (Морозов, 1977).