Читать книгу Мозг слушает. Как создается осмысленный звуковой мир - - Страница 4

Часть I
Как работает звук
Глава 1
Сигналы из внешнего мира

Оглавление

Эта вводная глава рассказывает о сигналах, раздающихся за пределами нашей головы, – о звуке. Звук – это всего лишь перемещающиеся туда-сюда молекулы воздуха. Замечательно, что этот простой механизм создает бесконечное разнообразие звуков – от Баха до скворчанья яичницы на сковородке, от песни “Rocky Raccoon” до копающегося в помойном баке енота. Звуки бывают громкими и тихими, высокими и низкими, консонансными или диссонансными, быстрыми и медленными, грубыми, визгливыми, хаотичными, полифоническими, свистящими или монотонными. Предлагаю вам прочувствовать красоту свойств звука – его компонентов, о которых мы будем говорить вновь и вновь по мере исследования звукового разума.

Звук – это движение. Когда дергают гитарную струну, она заставляет двигаться воздух в ближайшем окружении. На рис. 1.1 изображены колебания гитарной струны после щипка. Слева показана струна в свободном состоянии, и справа от нее – дюжина маленьких молекул воздуха. Когда гитарная струна находится в покое, локальное атмосферное давление составляет около 14,7 фунта на квадратный дюйм – давление воздуха на уровне моря. Когда струну дернули, она быстро отклоняется вправо и молекулы воздуха прижимаются ближе друг к другу, создавая более высокое давление[9]. Затем, через очень небольшой промежуток времени (сотые или тысячные доли секунды в зависимости от высоты ноты), гитарная струна движется в обратном направлении, минует исходное положение и смещается чуть левее. Тогда молекулы воздуха справа опять рассеиваются, и давление снижается. Но молекулы не возвращаются сразу к исходному состоянию, как было до натяжения струны. Теперь они рассеяны чуть в большей степени (занимают больший объем) и, следовательно, создают меньшее давление, чем было до первого движения струны. Затем они опять сжимаются, и опять рассеиваются, и еще, и еще, каждый раз чуть слабее, и, наконец, движение прекращается, вибрация затихает, звук умирает. Движение было звуком, и когда движение прекратилось, прекратился и звук.


Рис. 1.1. Струна сдвигает окружающие ее молекулы воздуха.


Компоненты звука

Большинство звуков определяется несколькими компонентами (рис. 1.2), как видимый предмет определяется формой, цветом, материалом и размером. Поскольку звук невидим, компоненты звука не так очевидны, но они чрезвычайно важны для осмысления звука. Я считаю, что если думать о звуке в терминах составляющих его компонентов – признавая важность того, что происходит с движущимися молекулами воздуха, – то его обработка в мозге становится еще более удивительной. Чтобы проследить за этими чудесными компонентами, я считаю, что полезным организующим принципом является представление о звуке в терминах высоты, временной развертки и тембра.


Рис. 1.2. Бесконечное разнообразие звуков возникает из-за движения воздуха и описывается небольшим количеством компонентов.


Высота

Высота – это то, что отличает “высокий” звук от “низкого”. Звук флейты мы называем высоким, а звук тубы – низким. То, что мы слышим и описываем этими терминами, является проявлением физического свойства частоты. Мы слышим высокий звук, когда колебания от высокого давления воздуха к низкому происходят очень быстро – с высокой частотой. Низким звукам соответствуют более медленные изменения давления воздуха – с низкой частотой (рис. 1.3). Высота звука – это категория восприятия, а частота – измеряемое физическое свойство. Нам следует хорошо понимать разницу между высотой и частотой, поскольку они не всегда идеально коррелируют.


Рис. 1.3. Серая волна описывает больше циклов (имеет большую частоту), чем черная, и поэтому звучала бы на более высокой ноте.


Частота не в качестве научной меры высоты звука, а как слово английского языка означает число каких-то событий за фиксированный интервал времени. Вы можете получать зарплату два раза в месяц. В городе Тампа во Флориде за год в среднем бывает 78 гроз. Я получаю спам по электронной почте 22 раза в неделю. Во всех этих случаях речь идет о частоте. Число колебаний давления воздуха в секунду отличает высоту звучания флейты от высоты звучания тубы. Число подобных событий в единицу времени (в секунду) измеряется в герцах (сокращенно Гц). Человеческое ухо воспринимает частоту колебаний давления воздуха в диапазоне от 20 до 20 000 Гц. Высоко звучащая флейта издает звуки с частотой от 250 до 2500 Гц, а низко звучащая туба – от 30 до 380 Гц. Забавно, что эти диапазоны частично перекрываются! Непременно напишу концерт для тубы и флейты, где более высокую партию будет исполнять туба.

Однако между частотой звука и высотой, которую мы слышим, не всегда соблюдается идеальная корреляция. Если мы улавливаем высоту звука (если этот звук можно пропеть), частота, на которой мы его пропоем, называется основной частотой. Волновые линии на рис. 1.4 имеют одинаковое количество пиков и провалов (примерно 35), так что номинально они имеют одну и ту же частоту. Однако они включаются и выключаются (модулируются) с разной скоростью. И высота слышимого нами звука определяется скоростью модуляции, а не частотой модулируемой волны.


Рис. 1.4. Черная и серая волны имеют одинаковую частоту. Однако скорость модуляции разная, то есть звук, обозначенный серой волной, включается и выключается быстрее, и поэтому он звучит выше, чем звук, обозначенный черной волной. Более быстрая модуляция звука, происходящая из-за более быстрых колебаний голосовых связок у женщин, объясняет более высокие голосовые ноты при произнесении одних и тех же слов.


Примером служит человеческий голос. Высота (основная частота) человеческой речи варьирует в диапазоне от 50 до 300 Гц. Основная частота речи соответствует скорости открытия и закрытия голосовых складок, приводимых в движение нашим дыханием. Скорость движения голосовых складок у мужчин самая низкая, так что у них более низкие голоса, а у детей – самая высокая, и голоса у них высокие. Интересно, что высота голоса разная не только у разных индивидуумов и разных полов, но связана и с некоторыми другими неожиданными факторами. Различия в основной частоте в целом наблюдаются у людей, говорящих на разных языках[10], а также в разных демографических группах людей, говорящих на одном и том же языке[11]. Возможно, вы и по себе заметили, что двуязычные люди обычно говорят на одном языке на более высоких нотах, чем на другом[12].

Тембр

В музыке тембр – важнейший параметр, позволяющий различить два инструмента, исполняющих одну и ту же ноту. В речи это главное средство для различения одного звука (гласного или согласного) от другого. Мужчина и женщина произносят одно и то же: основная частота (высота голоса) позволяет определить, кто есть кто. Женщина произносит два разных слова: тембр помогает отличить ее “со” от “су”. Физической мерой высоты звука является основная частота, а тембр определяется гармониками – более высокими частотами, чем основная частота.

Полезно знать, из каких частот состоит конкретный звук. Речь идет о так называемом звуковом спектре. Спектр камертона состоит из одной-единственной частоты и поэтому представляет собой одну тонкую вертикальную линию, как на верхней панели на рис. 1.5. У этого звука нет гармоник, только основная частота. Естественный звук, такой как “до” первой октавы в исполнении тромбона или кларнета, имеет пик в спектре на основной частоте “до” первой октавы, соответствующей 262 Гц, а также дополнительные пики на частотах, кратных основной частоте (524, 786 Гц и т. д.) Это и есть гармоники (гармонические обертоны). Как показано на средней и нижней панели на рис. 1.5, не все гармоники обладают одинаковой энергией. Относительный энергетический уровень гармоник является характеристикой тромбона и кларнета и объясняет, почему мы слышим разницу между ними. Уникальный характер гармоник определяется формой и конструкцией инструмента, производящего звук. Аналогичным образом форма и положение языка, губ и носа определяют спектр гармоник, характеризующих разные звуки речи.

В зависимости от положения губ и языка и от объема проходящего через рот и нос воздуха мы изменяем спектр издаваемого звука (какие-то из гармоник усиливаются), как показано на рис. 1.6. Хотя в спектре двух гласных звуков есть пики, отстоящие друг от друга на 100 Гц (поскольку в данном примере основная частота составляет 100 Гц), высота пиков, изображенных серыми линиями, очень разная. Это речевой аналог разницы между звуками тромбона и кларнета. В случае звука “и” два максимума серой линии приходятся на частоты 300 и 2300 Гц, в случае звука “у” они располагаются примерно на частотах 400 и 1000 Гц. Спектр речи имеет выпуклости – области с максимумом энергии, называемые формантами. Интересно, что эти полосы акустической энергии достаточно похожи у разных людей. Человек с высоким голосом имеет пики для звука “у” где-то в районе частот 400 и 1000 Гц, как и человек с низким голосом.


Рис. 1.5. Спектр камертона представляет собой единственную вертикальную линию на одной конкретной частоте – в данном случае 262 Гц, что соответствует ноте до первой октавы. В звуковом спектре инструмента, исполняющего ноту до, есть пик на частоте 262 Гц, а также несколько гармоник на кратных частотах. Звук “до” первой октавы в исполнении тромбона или кларнета имеет разный рисунок гармоник из-за резонансных характеристик этих инструментов. Спектры помогают понять, почему одна и та же нота до первой октавы звучит по-разному в исполнении разных инструментов (по оси x отложены частоты, по оси y – энергия).


Рис. 1.6. Вверху: спектр звука “и”, как в слове “лик”. Внизу: спектр звука “у”, как в слове “лук”. Оба звука имеют одинаковую основную частоту, но распределение энергии в гармониках различается принципиальным образом (по оси x отложены частоты, по оси y – энергия).


Таким образом, тембр – это восприятие звука, связанное с его гармоническим содержанием. Расположение гармоник и их относительная высота – физические свойства звука, позволяющие нам по тембру определять разницу между двумя инструментами или двумя голосами. В речи группы гармоник выделяются в спектре конкретных слов или слогов. Рисунок 1.7 иллюстрирует полный диапазон частот (основных частот и гармоник) голоса и некоторых музыкальных инструментов.


Рис. 1.7. Полный диапазон частот голоса и музыкальных инструментов. Слева показан диапазон основных частот, справа – диапазон гармоник.


Временная развертка

До сих пор мы говорили о камертоне, отдельных музыкальных нотах и гласных – все это примеры звуков, устойчивых на протяжении какого-то времени. Однако существует группа звуков, для которых определяющей характеристикой является время – не в том смысле, когда начинается и заканчивается звук, как слог или музыкальная нота, а в том смысле, как и когда звук развивается во времени. К этой группе относятся согласные звуки. При произнесении некоторых согласных звуков временная развертка играет важнейшую роль.


Рис. 1.8. “Бил” превращается в “пил” за счет добавления паузы длительностью 1 /20 с до начала произнесения гласного звука (по оси x отложено время, по оси y – энергия).


Произнесите вслух слово “был”. А потом слово “жил”. Можете описать, чем различаются механические движения вашего рта? Это довольно просто. В первом случае ваши губы смыкаются, а язык занимает некую нейтральную позицию. Во втором случае губы слегка приоткрыты, а задняя часть языка прижата к небу. А теперь скажите “бил” и “пил”. Это сложнее. В чем тут разница? Механическая разница между произнесением “б” и “п” не так уж очевидна. Язык и губы в обоих случаях находятся фактически в одном и том же положении. Основное отличие заключается во временной развертке – когда вы начинаете произносить гласную, то есть когда голосовые складки начинают издавать звук “и”. Произнося слово “бил”, вы включаете голос почти сразу. Однако при произнесении слова “пил” между тем, как ваши губы раскрываются, и тем моментом, когда вы начинаете произносить гласный звук, имеется очень короткий промежуток времени. В верхней части рис. 1.8 изображена звуковая волна слова “бил”. В нижнюю волну я включила паузу длительностью 1/20 секунды. Все колебания двух линий идентичны, за исключением этой добавленной паузы. Небольшой паузы до начала произнесения “и” достаточно, чтобы вторая волна отчетливо звучала как “пил”. Различие во времени в несколько долей секунды создает значительное различие в речи. Это одна из многих причин, почему для обработки таких едва заметных изменений звука нам с вами требуется сверхбыстрый слуховой мозг.

Анализируем изменения частоты во времени

Такие различия во временной развертке, как в “бил” и “пил”, хорошо видны на графиках временной зависимости типа изображенного на рис. 1.8. Различие в частоте, как в “и” и “у”, отражаются на спектрах, подобных тем, что представлены на рис. 1.6. Однако ни один из графиков не смог бы показать акустическое различие между звуками “б” и “г”. Здесь дело заключается в изменении частоты во времени. Чтобы правильно описать различие между “б” и “г”, нам нужен третий и последний график, называемый спектрограммой.

На верхней панели на рис. 1.9 представлен простой пример, изображающий звуковой тон, который со временем переходит от низкочастотного к высокочастотному и обратно, как в одобрительном свисте при виде чего-то впечатляющего. Вспомните звук сирены или представьте себе, что водите пальцем по клавиатуре фортепиано.

Различие между согласными в слогах “ба” и “га” определяется изменением частот полос акустической энергии во времени (нижняя панель). Верхняя полоса гармоник для “ба” и “га” одинаковая: она изменяется во времени от низкой до высокой частоты, пока не выравнивается на звуке “а”. Но на нижней полосе два слога различаются. В случае “ба” частота изменяется от низкой до высокой, а затем выравнивается. В случае “га” звук начинается на относительно более высокой частоте, а затем снижается. Частотная модуляция (ЧМ, или FM, от frequency modulation) – важная характеристика звука, которая отражает это изменение частоты во времени.


Рис. 1.9. Спектрограмма (график изменения частоты во времени). Вверху: частота увеличивается, затем уменьшается. Внизу: слоги “ба” и “га”. Частоты обеих волн акустической энергии изменяются со временем, пока не стабилизируются на гласном звуке “а”.


Таким образом, в обоих наших примерах с парами согласных звуков (“б”/“п” и “б”/“г”) временная развертка является важнейшим фактором, который необходимо учитывать. В случае слогов “ба” и “па” время является необходимым и достаточным элементом для выявления различия. В случае слогов “ба” и “га” различие определяется взаимодействием обоих факторов – времени и частоты. Хотя мы способны уловить и выделить эти звуковые различия, замедлив произнесение и произведя измерения, на практике они произносятся слишком быстро, чтобы мы могли осознанно воспринимать отличающие их параметры. Удивительно быстро. Подумайте об этом: знали ли вы о разнице между “ба” и “га” в контексте компонентов звука до того, как я вам об этом рассказала? Понимали ли вы, что пара мгновенных частотных модуляций может превратить “пегого дога” в “беглого бога”? Я совершенно определенно не могу определить на слух, что какая-то энергетическая полоса поднимается в “ба” и опускается в “га”. И эта скорость и тонкость объясняют сложность восприятия согласных звуков и требуют применения фонетического алфавита (Антон, Борис, Василий, Григорий…). Тонкость и сложность дифференцирования и трудности в восприятии этих звуков у некоторых людей имеют интересные последствия для речи и даже для чтения, как мы увидим далее.

При обсуждении временных параметров мы сконцентрировались на речи. И это не случайно. Речь функционирует в гораздо более быстрых рамках, чем другие звуки, включая музыку. Например, allegro – это музыкальный темп в диапазоне 120–170 ударов в минуту (уд/мин). Для простоты давайте рассмотрим музыкальную пьесу в темпе аллегро в ритме 150 уд/мин. Это соответствует двум с половиной ударам (четвертным нотам) в секунду. Так что каждая четвертная нота длится целых 400 миллисекунд (тысячных долей секунды), одна восьмая – 200 мс, а одна шестнадцатая – 100 мс. Пьеса “Полет шмеля” исполняется в еще более быстром темпе presto и интересна тем, что обычно для восприятия двух нот раздельно нам требуется целых 100 мс. Заставив шестнадцатые доли главной темы звучать по 80–85 мс, Римский-Корсаков превратил ноты в нечто напоминающее жужжание шмеля. Однако с речью совсем другая история. Согласные в обычной речи длятся так же коротко или еще короче – примерно от 20 до 40 мс. И мы можем почти бесконечно произносить речь, наполненную согласными звуками. К счастью для всех музыкантов, исполнявших “Полет шмеля”, эта пьеса короткая.

Другие компоненты звука

Интенсивность – это мера амплитуды изменений давления воздуха, которую мы воспринимаем как громкость: сколько воздуха сдвигает гитарная струна на рис. 1.1 и насколько высоки создаваемые ею волны, изображенные на рис. 1.3. В абсолютном измерении звук производит едва заметные изменения давления воздуха. Однако мы воспринимаем изменения давления в широчайшем диапазоне – от тишайших до самых громких звуков, различающихся по физическому давлению воздуха в десять триллионов раз. Поэтому, чтобы отобразить наше восприятие громкости звука с помощью каких-то удобных показателей, мы используем логарифмическую шкалу, переводя количество перемещенного воздуха в знакомые всем единицы интенсивности звука – децибелы (дБ). В результате диапазон в десять триллионов раз можно выразить в единицах от 0 дБ (это порог слышимости, ниже предела чувствительности самых чувствительных микрофонов) до 140 дБ – самого громкого звука, который мы в состоянии вынести.

Возможно, термины амплитудная и частотная модуляция (АМ и ЧМ) ассоциируются у вас только с настройкой радиоприемника. Однако АМ и ЧМ чрезвычайно важны для нашего звукового пространства и особенно для речи. АМ – это флуктуации интенсивности звука (амплитуды): громкий-тихий-громкий-тихий. Автомобильная сигнализация часто работает в режиме от громкого к тихому. Колебания голосовых складок при их открытии и закрытии осуществляют амплитудную модуляцию того, что мы произносим на нашей высоте голоса (на основной частоте). На рис. 1.4 отражена обычная форма АМ: один и тот же сигнал модулируется по амплитуде с разными скоростями.

Частотная модуляция отражает изменение частоты во времени. Когда в речи мы переходим от гласных к согласным и наоборот, полосы акустической энергии поднимаются и опускаются. Это и есть частотная модуляция (изменение на рис. 1.9).

Еще один компонент звука, который стоит упомянуть, это фаза. В начале главы мы обсуждали давление молекул воздуха справа от гитарной струны. Молекулы воздуха слева от струны на рис. 1.1, которые мы не показали, рассеиваются, когда молекулы справа сжимаются, и наоборот. В каждый конкретный момент времени движение струны одновременно сжимает и рассеивает соседние молекулы воздуха. Два человека, сидящие по разные стороны от гитары, слышат музыку, которая по сигналу и давлению различается по фазе на 180 градусов. Графики доходящих до них волн как бы перевернуты по отношению друг к другу. В зависимости от того, где вы находитесь, звук гитары достигает ваших ушей в разное время, или в разной фазе. Эти фазы важны для локализации источника звука, а сложение и погашение фаз играют роль в идентификации звуков в шумном пространстве или при наличии ревербераций (эха).

И, наконец, явление фильтрации. Фильтрация – это избирательное усиление или ослабление некоторых частот звукового сигнала. Мы фильтруем звук миллион раз в день – как преднамеренно, так и непреднамеренно. Любимая песня звучит по-разному, когда вы слушаете ее на домашней стереосистеме, в машине, через компьютер, через наушники или через мобильный телефон. Каждая система воспроизведения звука имеет свои фильтры, которые либо тщательно изготовлены специалистами по звуку, либо просто удовлетворяют таким параметрам товара, как размер и стоимость, или каким-то иным показателям. Ваш голос и голоса ваших друзей звучат по-разному на улице и в кафе. Фильтрация, вызванная твердой поверхностью стен, потолка и ванны, объясняет, почему мы любим петь под душем. Готические соборы имеют фигурные каменные поверхности, вызывающие многократное отражение звука на более высоких частотах, что обеспечивает особую акустическую атмосферу для музыки и речи. Попробуйте послушать звук своего мобильного телефона, переходя из комнаты в комнату. Кроме того, что звук фильтруется во внешнем пространстве, мы сами тоже преднамеренно фильтруем звуки, издаваемые ртом, языком и губами, чтобы произнести слова, требующиеся для передачи сообщения.

Сигналы снаружи и внутри головы: компоненты

Наш мозг придает смысл внешним сигналам (звукам) с помощью сигналов внутри головы – электрических импульсов нейронов.

Каждый ученый выбирает определенную стратегию научного поиска. Одни проводят опросы. Другие используют экспрессию генов. А третьи анализируют биомаркеры в крови. Мой выбор – сигналы. Мне эти сигналы (как снаружи, так и внутри головы) кажутся надежными, поскольку они ощутимые, в каком-то смысле не такие эфемерные, как сам звук. Их можно достоверно измерить, и есть общеизвестные и эффективные способы их визуализации и анализа. Особенно меня привлекает замечательное сходство между сигналами внутри головы и снаружи. Это очень красиво. И поразительно, что так происходит. Эта реальность дает мне нечто надежное, на что можно повесить шляпу, на что можно опереться, когда я исследую такие важные проблемы, как влияние занятий музыкой на звуковой разум, связь поддержания ритма и грамотности или последствия сотрясения мозга для обработки звука. Сигналы направляют ход моих мыслей и открывают мне Истину.

Компоненты звука играют важнейшую роль в понимании того, почему все люди слышат по-разному и как личный звуковой опыт каждого человека может меняться в лучшую или худшую сторону по мере того, как наш звуковой разум сплетается с нашими ощущениями, размышлениями, чувствами и движениями.

Как нейробиолог, я могу привнести эту осязаемость в мое исследование звука и его обработки в мозге. Я могу изучать восприятие высоты, временной развертки и тембра по отдельности и как слуховое целое, чтобы понять, что происходит правильно или неправильно у людей, которые слышат превосходно или испытывают некоторые затруднения. Можно изучать по отдельности обработку разных компонентов звука и их превращение в наши ощущения. Например, некоторые люди плохо различают звуки разной высоты, но без труда воспринимают тембр, или наоборот. У других проблемы возникают только с временными характеристиками звука. Музыканты и двуязычные люди слышат превосходно, но их мастерское восприятие сигналов опирается на разные компоненты звука.

Теперь давайте посмотрим, что происходит, когда звуковая волна снаружи головы создает мозговые волны внутри – когда движение гитарной струны достигает слухового прохода.

9

Это очень-очень небольшая перемена давления. Если я правильно использую формулы и единицы измерения, щипок гитарной струны поднимает атмосферное давление от 14,7 до 14,700003 фунта/дюйм2.

10

T. D. Hanley et al. “Some Acoustic Differences among Languages”. Phonetica 14 (1966): 97–107; A. B. Andrianopoulos et al. “Multimodal Standardization of Voice among Four Multicultural Populations: Fundamental Frequency and Spectral Characteristics”. Journal of Voice 15, no. 2 (2001): 194–219.

11

S. A. Xue et al. “Speaking F0 Characteristics of Elderly Euro-American and African-American Speakers: Building a Clinical Comparative Platform”. Clinical Linguistics & Phonetics 15, no. 3 (2001): 245–252.

12

B. Lee, D. V. L. Sidtis. “The Bilingual Voice: Vocal Characteristics when Speaking Two Languages across Speech Tasks”. Speech, Language and Hearing 20, no. 3 (2017): 174–185. Глава 2. Сигналы внутри головы

Мозг слушает. Как создается осмысленный звуковой мир

Подняться наверх