Читать книгу Tu cerebro y la música - Daniel J. Levitin - Страница 5
1 ¿QUÉ ES MÚSICA? DEL TONO AL TIMBRE
Оглавление¿Qué es música? Para muchos «música» sólo puede significar los grandes maestros: Beethoven, Debussy y Mozart. Para otros, «música» es Busta Rhymes, Dr. Dre y Moby. Para uno de mis profesores de saxo del Berklee College (y para legiones de aficionados al «jazz tradicional») cualquier cosa hecha antes de 1940 o después de 1960 no es en realidad música. Yo tenía amigos cuando era un crío en los años sesenta que venían a mi casa a oír a los Monkees porque sus padres les prohibían oír todo lo que no fuese música clásica, y otros cuyos padres sólo les dejaban oír y cantar himnos religiosos. Cuando Bob Dylan se atrevió a tocar una guitarra eléctrica en el festival folk de Newport en 1965 hubo gente que se fue y muchos de los que se quedaron le abuchearon. La Iglesia católica prohibió la música con polifonía (más de una pieza musical tocada al mismo tiempo), temiendo que eso haría dudar a la gente de la unicidad de Dios. La Iglesia prohibió también el intervalo musical de una cuarta aumentada, la distancia entre do y fa sostenido y conocido también como tritono (el intervalo de West Side Story de Leonard Bernstein en que Toni canta el nombre de «María»). Este intervalo se consideraba tan disonante que tenía que haber sido obra de Lucifer, y así la Iglesia lo llamó Diabolus in musica. Era el tono lo que provocaba la indignación de la Iglesia. Y fue el timbre lo que hizo que abucheasen a Dylan.
La música de compositores de vanguardia como Francis Dhomont, Robert Normandeau o Pierre Schaeffer fuerza los límites de lo que la mayoría de nosotros consideramos que es música. Yendo más allá del uso de melodía y armonía, y hasta más allá del uso de instrumentos, estos compositores se valen de grabaciones de diversos objetos, como martillos neumáticos, trenes y cataratas de agua. Corrigen luego las grabaciones, juegan con el tono y acaban combinándolas en un montaje organizado de sonido con el mismo tipo de trayectoria emotiva (la misma tensión y liberación) que la música tradicional. Los compositores de esta tradición son como los pintores que traspasaron los límites del arte realista y representativo: los cubistas, los dadaístas, muchos de los pintores modernos desde Picasso a Kandinsky y a Mondrian.
¿Qué tienen en común básicamente la música de Bach, Depeche Mode y John Cage? A un nivel más básico, ¿qué es lo que diferencia «What’s It Gonna Be?!» de Busta Rhymes o la Sonata Patética de Beethoven de, por ejemplo, la serie de sonidos que oyes si te sitúas en medio de Times Square, o de los que oyes en las profundidades de un bosque tropical? Según la definió en una frase célebre el compositor Edgard Varèse: «Música es sonido organizado».
Este libro se propone explicar desde una perspectiva neuropsicológica cómo afecta la música a nuestro cerebro, nuestra mente, nuestro pensamiento y nuestro espíritu. Pero conviene examinar primero de qué está hecha. ¿Cuáles son los componentes básicos fundamentales de la música? ¿Y cómo la originan cuando están organizados? Los elementos básicos de cualquier sonido son intensidad, tono, contorno, duración (o ritmo), tempo, timbre, ubicación espacial y reverberación. El cerebro organiza esos atributos perceptuales básicos en conceptos de nivel más elevado (igual que un pintor dispone las líneas en formas) y entre ellos se incluyen el compás, la armonía y la melodía. Cuando escuchamos música, estamos percibiendo en realidad atributos o «dimensiones» múltiples. He aquí un breve resumen de cuáles son:
Suele llamarse «tono» a un sonido musical diferenciado. Se utiliza también la palabra «nota», pero los científicos reservan esa palabra para referirse a algo que está anotado en una página o partitura de música. Los dos términos, «tono» y «nota», designan la misma entidad en el sentido abstracto, pero la palabra «tono» se refiere a lo que oyes y la palabra «nota» a lo que ves escrito en una partitura musical.
«Altura de tono» es una construcción puramente psicológica, relacionada tanto con la frecuencia real de un tono particular como con su posición relativa en la escala musical. Proporciona la respuesta a la pregunta «¿Qué nota es ésta?» («Un do sostenido»). Definiré más adelante la frecuencia y la escala musical.
«Ritmo» se refiere a las duraciones de una serie de notas, y a cómo se agrupan en unidades. Por ejemplo, en la «Alphabet Song» (lo mismo que «Twinkle, Twinkle Little Star») las notas de la canción son todas de igual duración para las letras A B C D E F G H I J K (con pausa de igual duración, o silencio, entre G y H), y luego las cuatro letras siguientes se cantan con la mitad de duración, o el doble de rápido por letra: L M N O (lo que provocó que generaciones de escolares se pasasen sus primeros meses creyendo que había una letra en el alfabeto llamada ellemmenno).
«Tempo» es la velocidad global o ritmo de la pieza.
«Contorno» es la forma global de una melodía, teniendo en cuenta sólo la pauta de «arriba» y «abajo» (si una nota sube o baja, no cuánto sube o baja).
«Timbre» es aquello que diferencia un instrumento de otro (por ejemplo, la trompeta del piano) cuando se toca con ambos la misma nota escrita. Es una especie de color tonal que se produce en parte por los armónicos de las vibraciones del instrumento.
«Intensidad» es un constructo puramente psicológico que se relaciona (no linealmente y de modos que no entendemos del todo) con la amplitud física de un tono.
«Ubicación espacial» es de dónde procede el sonido.
«Reverberación» se refiere a la percepción de lo lejos que está de nosotros la fuente del sonido en combinación con lo grande que es la habitación o sala de música en la que suena; se denomina a menudo entre los legos «eco», y es la cualidad que diferencia la amplitud del sonido cuando se canta en una sala de conciertos grande del sonido cuando cantas en la ducha. Se infravalora su influencia en la transmisión de emociones y en la producción de un sonido global agradable.
Estos atributos son separables. Puede modificarse cada uno de ellos sin alterar los demás, lo que permite estudiarlos científicamente de uno en uno, que es la razón de que podamos concebirlos como dimensiones. La diferencia entre «música» y una serie de sonidos al azar o desordenada está relacionada con el modo que tienen de combinarse estos atributos fundamentales y las relaciones que establecen entre sí. Cuando estos elementos básicos se combinan y relacionan de una forma significativa, originan conceptos de orden superior, como «compás», «tonalidad», «melodía» y «armonía».
El compás lo crea el cerebro extrayendo información de las claves de ritmo y volumen, y es el modo en que se agrupan los tonos entre sí a lo largo del tiempo. Un compás de vals organiza los tonos en grupos de tres, una marcha en grupos de dos o de cuatro.
«Tonalidad» es el orden de importancia entre los tonos en una pieza musical; esta jerarquía no existe en el mundo, existe sólo en nuestra mente, como consecuencia de nuestras experiencias con un estilo musical y con idiomas musicales y con los esquemas mentales que todos desarrollamos para entender la música.
«Melodía» es el tema principal de una pieza musical, la parte que cantas con ella, la sucesión de tonos que destacan más en tu mente. La noción de melodía varía con los géneros. En la música rock, lo característico es que haya una melodía para las estrofas y otra para el coro, y las estrofas se diferencian por un cambio en la letra y a veces por un cambio de instrumentación. En la música clásica, la melodía es un punto de partida para que el compositor cree variaciones sobre ese tema, que se pueden utilizar a lo largo de toda la pieza de formas diferentes.
La «armonía» se basa en las relaciones entre la altura de los diversos tonos, y los marcos tonales que esos tonos establecen y que crean expectativas de lo que llegará a continuación en una pieza musical..., expectativas que un compositor hábil puede satisfacer o quebrantar con finalidades expresivas y artísticas. Armonía puede significar simplemente una melodía paralela a la primaria (como cuando armonizan dos cantantes) o puede referirse a una progresión de acordes, las agrupaciones de notas que forman un marco y un fondo en el que se apoya la melodía.
La idea de elementos primarios que se combinan para crear arte, y la importancia de las relaciones entre esos elementos, se da también en el arte visual y en la danza. Los elementos principales de la percepción visual son el color (que se puede descomponer en las tres dimensiones de tono, saturación y claridad), brillantez, ubicación, textura y forma. Pero un cuadro es más que esas cosas: no es sólo una línea aquí y otra allá, o un punto de rojo en una parte y un sector de azul en otra. Lo que convierte un conjunto de líneas y de colores en arte es la relación entre una línea y otra; cómo un color o una forma se hacen eco de otro u otra en una parte distinta del cuadro. Esos toques de pintura y esas líneas se convierten en arte cuando la forma y la fluidez (cómo se ve arrastrada la mirada a lo largo del cuadro) se crean a partir de elementos perceptuales de orden inferior. Cuando se combinan armoniosamente acaban dando origen a la perspectiva, el primer plano y el plano de fondo, la emoción y otros atributos artísticos. Asimismo, la danza no es sólo un mar tempestuoso de movimientos corporales sin relación; lo que los integra y complementa es la relación de esos movimientos entre sí, lo que aporta una coherencia y una cohesión que procesan los niveles superiores del cerebro. Y en la música, lo mismo que en el arte visual, se juega no sólo con las notas que se emiten, sino con las que no se emiten. Miles Davis hizo una descripción famosa de su técnica de improvisación paralela a la descripción que hizo Picasso de cómo utilizaba él un lienzo: el aspecto más decisivo del trabajo, decían ambos artistas, no eran los objetos en sí, sino el espacio entre los objetos. Miles, en concreto, describió la parte más importante de sus solos como el espacio vacío entre notas, el «aire» que introducía entre una nota y la siguiente. Saber con exactitud cuándo emitir la nota que sigue y dar tiempo al oyente para anticiparlo, es un rasgo distintivo del talento de Davis. Resulta particularmente notorio en su álbum Kind of Blue.
Para los que no son músicos, términos como «diatónico», «cadencia» o incluso «tonalidad» y «tono» pueden constituir una barrera innecesaria. Músicos y críticos parecen vivir a veces tras un velo de términos técnicos que pueden parecer pretenciosos. ¿Cuántas veces has leído una crítica de un concierto en el periódico y te has encontrado con que no tienes ni idea de lo que está diciendo el crítico? «Su appoggiatura creó una incapacidad para completar la roulade.» O, «¡Me parece increíble que modulasen hasta do sostenido menor! ¡Qué ridículo!» Lo que en realidad queremos saber es si la música se interpretó de una forma que conmovió al público. Si la cantante pareció encarnar al personaje sobre el que estaba cantando. Tal vez quisieses que el crítico comparase la actuación de esa noche con la de la noche anterior o con un conjunto diferente. Lo que nos interesaba normalmente era la música, no los instrumentos técnicos utilizados. No aguantaríamos que el crítico gastronómico de un restaurante se pusiera a especular sobre la temperatura exacta a la que el chef añadió zumo de limón a una salsa holandesa, ni que un crítico de cine nos hablase de la apertura de lente utilizada por el cineasta; no deberíamos aguantarlo tampoco en el caso de la música.
Además, muchos de los que estudian música (incluso musicólogos y científicos) discrepan sobre el significado de alguno de esos términos. Utilizamos el término «timbre», por ejemplo, para designar el sonido global o el color tonal de un instrumento, esa característica indescriptible que diferencia a una trompeta de un clarinete aunque estén tocando la misma nota escrita, o lo que diferencia tu voz de la de Brad Pitt al pronunciar las mismas palabras. Pero la incapacidad para ponerse de acuerdo en una definición ha conducido a la comunidad científica a tomar la insólita medida de alzar las manos y definir timbre como lo que no es. (La Acoustical Society of America lo define como todo lo relacionado con un sonido que no es intensidad ni tono. ¡Menuda precisión científica!)
¿Qué es tono? Esta simple pregunta ha generado centenares de artículos científicos y miles de experimentos. Tono es la frecuencia o velocidad de vibración de una cuerda, una columna de aire u otra fuente física de sonido. Si una cuerda vibra de manera que se mueva hacia delante y hacia atrás sesenta veces en un segundo, decimos que tiene una frecuencia de sesenta ciclos por segundo. La unidad de medida, ciclos por segundo, suele llamarse hercio (abreviado Hz), por Heinrich Hertz, el físico teórico alemán que fue el primero que transmitió ondas de radio (teórico hasta la médula, cuando le preguntaron qué utilidad práctica podrían tener las ondas de radio, parece ser que se encogió de hombros y contestó: «Ninguna»). Si tuvieses que intentar remedar el sonido de la sirena de un vehículo de bomberos, tu voz recorrería diferentes tonos o frecuencias (al cambiar la tensión de tus pliegues vocales), algunos «bajos» y algunos «altos».
Las teclas de la izquierda del teclado del piano golpean cuerdas más gruesas y más largas que vibran a una tasa relativamente lenta. Las de la derecha, cuerdas más cortas y más finas que vibran a una tasa más alta. La vibración de esas cuerdas desplaza moléculas de aire y las hace vibrar a la misma velocidad, es decir, con la misma frecuencia que la cuerda. Estas moléculas de aire vibrante son las que llegan a nuestro tímpano, y lo hacen moverse hacia dentro y hacia fuera con la misma frecuencia. La única información que recibe el cerebro sobre el tono del sonido viene de ese movimiento hacia dentro y hacia fuera del tímpano; el oído interno y el cerebro tienen que analizar ese movimiento para calcular qué vibraciones del mundo exterior hacen moverse de ese modo el tímpano.
Cuando usamos las teclas más próximas a la izquierda del teclado, decimos, por convención, que son sonidos de tono «grave», y los de las próximas al lado derecho del teclado que son de tono «agudo». Es decir, los sonidos que llamamos «graves» son los que vibran lentamente, y están más próximos (en frecuencia de vibración) al sonido de los ladridos de un perro grande. Los que llamamos «agudos» son los que vibran rápidamente y están más próximos a los débiles ladridos que podría emitir un perro pequeño. Pero incluso estos términos, «agudo» y «grave», son culturalmente relativos: los griegos hablaban de los sonidos en sentido contrario, porque los instrumentos de cuerda que ellos construían tendían a estar orientados verticalmente. Las cuerdas más cortas o los tubos de órgano más cortos tenían sus partes superiores más próximas al suelo, y se llamaban por ello notas «bajas» (como en «baja hasta el suelo»), y las cuerdas y tubos más largos (que se elevaban hacia Zeus y Apolo) se llamaban notas «altas». «Bajo» y «alto» (lo mismo que «izquierda» y «derecha») son en realidad términos arbitrarios que tienen que memorizarse. Algunos autores han alegado que «alto» y «bajo» son etiquetas intuitivas, y que lo que llamamos sonidos de tono alto proceden de los pájaros (que están subidos a los árboles o en el cielo) y lo que llamamos sonidos de tono bajo suelen proceder de grandes mamíferos próximos al suelo como los osos o el ruido de un terremoto. Pero esto no resulta convincente, ya que hay sonidos bajos que vienen también de arriba (pensemos en el trueno) y sonidos altos que vienen de abajo (los grillos y las ardillas, las hojas que pisamos).
Como una primera definición de tono, digamos que es esa cualidad que distingue primordialmente el sonido asociado a pulsar una tecla de piano frente a otra.
Pulsar una tecla hace que un macillo golpee una o más cuerdas dentro del piano. Al golpearla la desplaza, estirándola un poco, y su elasticidad intrínseca hace que vuelva hacia su posición original. Pero excede esa posición original, yendo demasiado lejos en la dirección opuesta, y luego intenta volver una vez más a su posición original, excediéndose de nuevo, y oscila así hacia delante y hacia atrás. Cada oscilación va cubriendo menos distancia y llega un momento en que la cuerda dejará por completo de moverse. Por eso el sonido que oímos al pulsar una tecla de piano se suaviza hasta perderse en la nada. El cerebro traduce la distancia que la cuerda recorre con cada oscilación hacia delante y hacia atrás como intensidad; la tasa a la que oscila se traduce como altura de tono. Cuanto más lejos llega la cuerda, más fuerte nos parece el sonido; cuando casi no se desplaza, el sonido parece suave. Aunque pudiese parecer contradictorio, la distancia recorrida y la tasa de oscilación son independientes. Una cuerda puede vibrar muy deprisa y recorrer bien una gran distancia o una distancia pequeña. La extensión que recorre depende de lo fuerte que la pulsemos: esto se corresponde con nuestra intuición de que al pulsar algo más fuerte el sonido es fuerte. La velocidad a la que vibra la cuerda depende principalmente de su tamaño y de lo tensa que esté, no de lo fuerte que se haya pulsado.
Podría parecer que deberíamos limitarnos a decir que tono es lo mismo que frecuencia; es decir, la frecuencia de vibración de las moléculas de aire. Esto es casi cierto. Cartografiar el mundo físico sobre el mundo mental raras veces resulta tan directo. Sin embargo, en los sonidos más musicales, tono y frecuencia están estrechamente relacionados.
La palabra tono alude a la representación mental que un organismo tiene de la frecuencia básica de un sonido. Es decir, tono es un fenómeno psicológico relacionado con la frecuencia de las moléculas de aire que vibran. Con lo de «psicológico» quiero decir que se trata de algo que está exclusivamente en nuestra mente, no en el mundo exterior; es el producto final de una cadena de acontecimientos mentales que da origen a una representación o cualidad mental interna por completo subjetiva. Las ondas sonoras en sí mismas (moléculas de aire que vibran con frecuencias diversas) no tienen tono. Su movimiento y sus oscilaciones se pueden medir, pero hace falta un cerebro humano (o animal) para cartografiarlas respecto a esa cualidad interna que llamamos tono.
Percibimos el color de una forma similar, y fue Isaac Newton quien primero se dio cuenta de eso. (Newton, por supuesto, es conocido como el descubridor de la teoría de la gravedad, y el inventor, junto con Leibniz, del cálculo diferencial. Era, como Einstein, muy mal estudiante, y sus profesores se quejaban a veces de su falta de atención. Al final lo echaron de la escuela.)
Newton fue el primero que indicó que la luz es incolora, y que en consecuencia el color tiene que producirse dentro de nuestro cerebro. «Las ondas en sí —escribió— no tienen color.» Desde su época, hemos llegado a saber que las ondas luminosas se caracterizan por diferentes frecuencias de oscilación, y cuando impactan en la retina de un observador desencadenan una serie de fenómenos neuroquímicos cuyo producto final es una imagen mental interior a la que llamamos color. Aunque una manzana pueda parecer roja, sus átomos no son rojos. Y del mismo modo, como señala el filósofo Daniel Dennett, el calor no está compuesto de pequeñas cositas calientes.
Un budín sólo tiene gusto cuando yo lo meto en la boca, cuando entra en contacto con la lengua. No tiene gusto ni sabor cuando está en la nevera, sólo el potencial. Así también, las paredes de mi cocina no son «blancas» cuando yo abandono la cocina. Aún tienen sobre ellas pintura, por supuesto, pero el «color» sólo se produce cuando interactúan con mis ojos.
Las ondas sonoras impactan en los tímpanos y en el pabellón auricular (las partes carnosas de la oreja), poniendo en marcha una cadena de acontecimientos mecánicos y neuroquímicos cuyo producto final es una imagen mental interna a la que llamamos tono. Si cae un árbol en el bosque y no hay nadie allí para oírlo, ¿produce un sonido? (El primero que planteó esta cuestión fue el filósofo irlandés George Berkeley.) Sencillamente, no: sonido es una imagen mental creada por el cerebro en respuesta a moléculas que vibran. Del mismo modo, no puede haber tono sin un ser humano o un animal presente. Un instrumento de medición adecuado puede registrar la frecuencia producida por el árbol cayendo, pero en realidad no hay tono a menos que se oiga.
Ningún animal puede oír un tono por cada frecuencia que existe, del mismo modo que los colores que vemos son en realidad una pequeña porción del espectro electromagnético. El sonido puede oírse teóricamente para vibraciones que van justo de los 0 ciclos por segundo hasta los 100.000 o más, pero cada animal oye sólo un subconjunto de los sonidos posibles. Los seres humanos que no padecen ningún tipo de pérdida auditiva pueden normalmente oír sonidos que van desde los 20 hercios hasta los 20.000. Los tonos del extremo bajo suenan como un ruido sordo impreciso o un temblor: ése es el sonido que oímos cuando pasa un camión al otro lado de la ventana (el motor produce un sonido en torno a los 20 hercios) o cuando un coche trucado con un sistema de sonido de primera tiene puestos los bafles de bajos realmente fuerte. Algunas frecuencias (las que quedan por debajo de los 20 hercios) son inaudibles para los seres humanos, porque los mecanismos fisiológicos de nuestros oídos no son sensibles a ellas.
Que el rango de la audición humana suela ser de 20 hercios a 20.000 no significa que el rango de la percepción tónica humana sea el mismo; aunque podemos oír sonidos en ese rango completo, no todos son musicales; es decir, no podemos asignar sin ambigüedad un tono a un rango completo. Por analogía, los colores en los extremos infrarrojo y ultravioleta del espectro carecen de definición comparados con los colores más próximos al centro. La figura de la página 64 muestra el rango de los instrumentos musicales y la frecuencia asociada con ellos. El sonido de la voz del varón medio hablando es de unos 110 hercios, y el de la mujer media, de unos 220. El zumbido de las luces fluorescentes o de una instalación eléctrica defectuosa es de 60 hercios (en América del Norte; en Europa y en países con una medida diferente de voltaje/corriente puede ser de 50). El sonido que emite una cantante al romper un vaso con la voz podría llegar a ser de 1.000 hercios. El cristal se rompe porque, como todos los objetos físicos, tiene una frecuencia vibratoria intrínseca y natural. Puedes oírla dando al vaso un golpecito con el dedo o, si es de cristal fino, recorriendo el borde con el dedo mojado en un movimiento circular. Cuando la cantante alcanza la frecuencia adecuada (la frecuencia resonante del cristal) hace vibrar a las moléculas de éste a su velocidad natural, y el cristal estalla.
Un piano normal tiene 88 teclas. Los pianos pueden tener en casos muy raros unas cuantas teclas extra al fondo y los pianos eléctricos, los órganos y los sintetizadores tienen sólo 12 o 24 teclas, pero se trata de casos especiales. La nota más baja en un piano normal vibra con una frecuencia de 27,5 hercios. Curiosamente, ésta es de forma aproximada la velocidad de movimiento que constituye un importante umbral de la percepción visual. Una sucesión de fotos fijas (diapositivas) desplegadas a esa velocidad de presentación o a una velocidad próxima a ella darán la ilusión de movimiento. El cine es una secuencia de imágenes fijas alternando con trozos de película negra presentadas a una velocidad (un cuarentaiochoavo de segundo) que excede la capacidad de resolución temporal del sistema visual humano. Percibimos un movimiento suave y continuo cuando no es eso en realidad lo que se nos está mostrando. Si las moléculas vibran en torno a esa velocidad oímos algo que suena como un nota continua. Si colocaste alguna vez naipes en los radios de la rueda de tu bicicleta cuando eras niño, te demostraste a ti mismo un principio relacionado: a velocidades lentas, oyes simplemente el click-click-click de la carta golpeando los radios. Pero superada cierta velocidad, los clicks se juntan y crean un zumbido, una nota que puedes realmente tararear a compás; un tono.
Cuando se toca esa nota más baja en el piano y vibra a 27,5 hercios, para la mayoría de la gente carece del tono distintivo de los sonidos de hacia la zona media del teclado. En los extremos más bajo y más alto del teclado del piano, las notas suenan borrosas para muchas personas por lo que se refiere a su tono. Los compositores lo saben y usan esas notas o las evitan según lo que intenten conseguir desde el punto de vista compositivo y emotivo. Los sonidos con frecuencias por encima de la nota más alta del teclado del piano, en torno a los 6.000 hercios y más, suenan como un chillido de tono agudo para la mayoría de la gente. Por encima de los 20.000 hercios la mayoría de los seres humanos no oyen nada, y a los sesenta años de edad la mayoría de los adultos no pueden oír gran cosa por encima de unos 15.000 hercios, debido al anquilosamiento de las células capilares en el oído interno. Así que cuando hablamos del registro de las notas musicales, o de esa parte restringida del teclado del piano que transmite la sensación más fuerte de tono, estamos hablando aproximadamente de tres cuartas partes de las notas del teclado, entre unos 55 hercios y unos 2.000.
El tono es uno de los medios primordiales de transmitir emoción musical. Hay una serie de factores que comunican estados de ánimo, excitación, calma, amor romántico o peligro, pero el tono figura entre los más decisivos. Una sola nota aguda puede transmitir excitación, una sola nota grave, tristeza. Cuando las notas se pulsan juntas, se consiguen frases musicales más potentes y más matizadas. Las melodías están definidas por la pauta o relación de tonos sucesivos a lo largo del tiempo; la mayoría de la gente no tiene ningún problema para identificar una melodía que se interprete en una tonalidad más alta o más baja que aquella en que la oyeron anteriormente. De hecho, muchas melodías no tienen un tono inicial «correcto», flotan libres en el espacio, empezando en cualquier parte. «Cumpleaños Feliz» es un ejemplo. Así que una forma de pensar en una melodía es considerarla como un prototipo abstracto que se deriva de combinaciones específicas de tonalidad, tempo, instrumentación, etc. Una melodía es un objeto auditivo que mantiene su identidad a pesar de las transformaciones, igual que una silla mantiene su identidad aunque la traslades de un lugar a otro de la habitación, la pongas patas arriba o la pintes de rojo. De modo que si oyes, por ejemplo, una canción tocada más fuerte de lo que estás acostumbrado a oírla, sigues identificándola pese a todo como la misma canción. Lo mismo se cumple respecto a los cambios en los valores tónicos absolutos de la canción, que pueden modificarse siempre que se mantengan iguales las distancias relativas entre ellos.
El concepto de valores tónicos relativos es fácil de ver en nuestro modo de hablar. Cuando le haces a alguien una pregunta, subes espontáneamente la voz elevando la entonación al final de la frase, para indicar que estás preguntando. Pero no intentas que la elevación de la voz se atenga a un tono específico. Basta con que acabes la frase con un tono un poco más alto que como la empezaste. Esto es una convención (aunque no en todas las lenguas, es algo que se ha de aprender), y los lingüistas la conocen como una clave prosódica. Hay convenciones similares para la música escrita en la tradición occidental. Ciertas secuencias de tonos evocan calma, otras, excitación. La base cerebral de este efecto se debe primordialmente al aprendizaje, del mismo modo que aprendemos que una entonación creciente indica una pregunta. Todos tenemos una capacidad innata para aprender las distinciones lingüísticas y musicales de la cultura en la que hayamos nacido, y la experiencia con la música de esa cultura conforma nuestros canales neuronales para que acabemos interiorizando una serie de reglas comunes a esa tradición musical.
Los diferentes instrumentos utilizan partes distintas del registro de tonos disponibles. El piano es el instrumento que tiene un registro más amplio, como se puede ver en la ilustración de la página 64. Los otros instrumentos utilizan un subconjunto de los tonos disponibles, y esto influye en el uso de esos instrumentos para comunicar emoción. El flautín, con su sonido de tono agudo, estridente y como de pájaro, tiende a evocar estados de ánimo felices y despreocupados independientemente de las notas que se toquen en él. Por esa razón, los compositores tienden a utilizarlo para música feliz, o estimulante, como en la marcha de Sousa. Asimismo, Prokofiev utiliza la flauta en Pedro y el lobo para representar al pájaro, y la trompa de pistones para indicar al lobo. La individualidad de los personajes se expresa en Pedro y el lobo con los timbres de diferentes instrumentos y cada uno tiene un leitmotiv, una frase o figura melódica asociada que acompaña a la reaparición de una idea, una persona o una situación. (Es algo que se da en especial en el drama musical wagneriano.) Un compositor que elige secuencias con un tono supuestamente triste sólo se las asignaría al flautín si estuviese intentando ser irónico. Los sonidos graves y pesados de la tuba o del contrabajo suelen utilizarse para evocar solemnidad, gravedad o peso.
¿Cuántos tonos únicos hay? Como el tono procede de un continuo (las frecuencias migratorias de moléculas) hay técnicamente un número infinito de tonos: por cada par de frecuencias que menciones, siempre podrías encontrar una entre ellas, y teóricamente existiría un tono distinto. Pero no todos los cambios de frecuencia producen una diferencia de tono apreciable, lo mismo que añadir un grano de arena a tu mochila no cambia perceptiblemente su peso. Así que no todos los cambios de frecuencia tienen utilidad musical. No todos tenemos la misma capacidad para detectar pequeños cambios de frecuencia; la formación puede ayudar, pero hablando en términos generales, la mayoría de las culturas no utilizan distancias mucho más pequeñas que un semitono como base de su música, y la mayoría de las personas no pueden percibir de modo fidedigno cambios más pequeños que aproximadamente una décima de semitono.
La capacidad para apreciar diferencias de tono depende de la fisiología, y varía de un animal a otro. La membrana basilar del oído interno humano tiene células capilares selectivas respecto a la frecuencia que sólo se activan con una gama de frecuencias determinada. Están distribuidas a lo largo de la membrana siguiendo un orden que va de frecuencias bajas a altas; los sonidos de frecuencia baja excitan las células capilares de un extremo de la membrana basilar, los de frecuencia media excitan las de la zona media y los de alta frecuencia, las del otro extremo. Podemos imaginar que la membrana contiene un mapa de tonos diferentes muy parecido al teclado de un piano colocado sobre ella. Como los diferentes tonos están extendidos por la topografía superficial de la membrana, a eso se le llama un mapa tonotópico.
Los sonidos, una vez que entran en el oído, pasan por la membrana basilar, donde se activan células capilares determinadas, según la frecuencia de los sonidos. La membrana es como una lámpara de detección de movimiento en el jardín; la actividad en una parte determinada de la membrana hace que ésta envíe una señal eléctrica al córtex auditivo. El córtex auditivo tiene también un mapa tonotópico, con tonos que van de bajos a altos extendidos a lo largo de la superficie cortical. En este sentido, el cerebro contiene un «mapa» de diferentes tonos, y diferentes zonas del cerebro responden a diferentes tonos. El tono es tan importante que el cerebro lo representa directamente; a diferencia de lo que sucede con casi cualquier otro atributo musical, podríamos colocar electrodos en el cerebro y ser capaces de determinar qué tonos se estaban interpretando para una persona sólo viendo la actividad cerebral. Y aunque la música se basa en relaciones de tono más que en valores tónicos absolutos, a lo que el cerebro presta atención a lo largo de sus diversas etapas de procesamiento es, paradójicamente, a estos valores tónicos absolutos.
Una «escala» no es más que un subconjunto del número teóricamente infinito de tonos, y cada cultura selecciona los que están basados en la tradición histórica o lo hace de una forma un tanto arbitraria. Los tonos específicos elegidos son luego consagrados como parte de ese sistema musical. Ésas son las letras que vemos en la figura anterior. Los nombres «A», «B», «C», etc., son etiquetas arbitrarias que asociamos con frecuencias determinadas. En la música occidental (la música de la tradición europea) estos tonos son los únicos tonos «legales»; la mayoría de los instrumentos están diseñados para tocar esos tonos y no otros. (Instrumentos como el trombón y el violonchelo son una excepción, porque pueden deslizarse entre notas; los que tocan el trombón, el violonchelo, el violín, etc., pasan mucho tiempo aprendiendo a oír y producir las frecuencias precisas necesarias para cada una de las notas legales.) Los sonidos intermedios se consideran errores («desentonar») a menos que se utilicen para lograr entonación expresiva (tocar a propósito algo desentonado, brevemente, para añadir tensión emotiva) o en el paso de un tono legal a otro.
«Sintonía» es la relación precisa entre la frecuencia de un tono que se está tocando y una unidad de medición estándar, o entre dos o más tonos que se están tocando al mismo tiempo. Los músicos orquestales que «afinan» o «sintonizan» antes de una interpretación están sincronizando sus instrumentos (que varían espontáneamente en su sintonía porque la madera, el metal, las cuerdas y otros materiales se expanden y contraen con los cambios de temperatura y de humedad) a una frecuencia estándar, o a veces no a una estándar, sino entre ellos. Los músicos expertos modifican a menudo la frecuencia de tonos mientras están tocando con propósitos expresivos (salvo, por supuesto, en instrumentos de tono fijo como los teclados y los xilófonos); tocar una nota un poco más alto o más bajo de su valor nominal puede transmitir emoción cuando se hace con habilidad. Los músicos expertos que tocan juntos en grupos modificarán también el tono de las notas que tocan para sintonizarlas con las de los otros músicos, en caso de que uno o más de ellos se desvíe de la sintonía estándar durante la interpretación.
Los nombres de las notas en la música occidental son do - re - mi - fa - sol - la - si - do (este sistema se utiliza como letra en la canción de Rodgers y Hammerstein «Do-Re-Mi» de The Sound of Music: «Do, a deer, a female deer, Re, a drop of golden sun...»). A medida que las frecuencias se hacen más altas, van sucediéndose los nombres de las letras, en el primer sistema; B una frecuencia más alta que A (y por tanto un tono más alto) y C una más alta que A o B. Después de G, los nombres de las notas empiezan de nuevo en A. Las notas del mismo nombre tienen frecuencias que son múltiplos entre sí. Una de las diversas notas que llamamos A tiene una frecuencia de 55 hercios y todas las otras notas que llamamos A tienen dos, tres, cuatro, cinco veces esa frecuencia (o la mitad).
Se trata de una cualidad fundamental de la música. Los nombres de las notas se repiten por un fenómeno perceptivo que se corresponde con la duplicación y la división por la mitad de las frecuencias. Cuando duplicamos o dividimos por dos una frecuencia, acabamos con una nota que suena notoriamente similar a aquella con la que empezamos. Esta relación, una proporción de frecuencia de dos/uno o uno/dos, se denomina la octava. Es tan importante que, a pesar de las grandes diferencias que existen entre las culturas musicales (la india, la balinesa, la europea, la del Oriente Próximo, la china, etc.), todas las que conocemos tienen la octava como la base de su música, aunque ésta tenga poco más en común con las otras tradiciones musicales. Este fenómeno conduce a la idea de circularidad en la percepción tónica, y es similar a la circularidad en los colores. Aunque el rojo y el violeta se encuentran en extremos opuestos del continuo de frecuencias visibles de la energía electromagnética, las vemos como preceptivamente similares. Lo mismo sucede en la música, de la que suele decirse que tiene dos dimensiones, una que explica que los tonos aumentan de frecuencia (y suenan más y más alto) y otra que explica la sensación que tenemos de que hemos vuelto a casa cada vez que duplicamos la frecuencia de una nota.
Cuando hombres y mujeres hablan al unísono, sus voces están normalmente separadas una octava, aunque intenten hablar con los mismos tonos exactos. Los niños hablan en general una octava o dos más alto que los adultos. Las dos primeras notas de la melodía de Harold Arlen «Somewhere Over the Rainbow» (de la película El mago de Oz) hacían una octava. En «Hot Fun in the Summertime» de Sly and the Family Stone, Sly y los cantantes que lo acompañan cantan en octavas durante el primer verso de la estrofa «End of the spring and here she comes back». A medida que aumentamos las frecuencias tocando las notas sucesivas en un instrumento, tenemos una sensación muy fuerte de que cuando llegamos a una duplicación de frecuencia, hemos vuelto otra vez a «casa». La octava es tan básica que incluso algunas especies animales (los monos y los gatos, por ejemplo) muestran equivalencia de octava, la capacidad para tratar como similares, lo mismo que los humanos, notas separadas por esta cuantía.
Un «intervalo» es la distancia entre dos notas. La octava de la música occidental está subdividida en doce notas (logarítmicamente) espaciadas por igual. El intervalo entre la y si (o entre do y re) es lo que se llama un tono o paso completo. (Este último término es confuso, porque llamamos tono a cualquier sonido musical; para evitar la ambigüedad utilizaré «paso completo».) La división más pequeña de nuestra escala occidental corta por la mitad perceptualmente ese paso completo: es lo que se llama un semitono, que es un doceavo de una octava.
Los intervalos son la base de la melodía, mucho más que los tonos concretos de las notas; el proceso de la melodía es relacional, no absoluto, lo que quiere decir que definimos una melodía por sus intervalos, no por las notas concretas que utilizamos para crearlos. Cuatro semitonos forman siempre el intervalo conocido como una tercera mayor, independientemente de si la primera nota es un la o un sol o cualquier otra nota. He aquí un cuadro de los intervalos que se conocen en nuestro sistema musical (occidental):
Distancia de semitonos | Nombre de intervalo |
0 | unísono |
1 | segunda menor |
2 | segundo mayor |
3 | tercera menor |
4 | tercera mayor |
5 | cuarta justa |
6 | cuarta aumentada, quinta disminuida, o tritono |
7 | quinta justa |
8 | sexta menor |
9 | sexta mayor |
10 | séptima menor |
11 | séptima mayor |
12 | octava |
El cuadro podría continuar: trece semitonos es una novena menor, catorce semitonos es una novena mayor, etc., pero sus nombres sólo se usan en realidad en análisis más avanzados. Los intervalos de cuarta justa y quinta justa se llaman así porque tienen un sonido particularmente agradable para muchas personas, y desde los antiguos griegos esta característica especial de la escala estará en el corazón de toda la música. (No hay ninguna «quinta imperfecta», éste es justamente el nombre que damos al intervalo.) Ignora la cuarta justa y la quinta justa o utilízalas en todas las frases, han sido la columna vertebral de la música durante cinco mil años como mínimo.
Aunque las áreas del cerebro que reaccionan a tonos individuales han sido cartografiadas, aún no hemos conseguido hallar la base neurológica de la codificación de las relaciones tonales; sabemos qué sector del córtex participa en la audición de las notas do y mi, por ejemplo, y fa y la, pero no sabemos cómo o por qué ambos intervalos se perciben como una tercera mayor, o los circuitos neurales que crean esta equivalencia perceptual. Esas relaciones deben establecerse mediante procesos cognitivos del cerebro que aún comprendemos mal.
Si hay doce llamadas notas dentro de una octava, ¿por qué sólo hay siete sílabas do-re-mi-fa-sol-la-si (o letras)? Después de siglos viéndose obligados a comer con los sirvientes y a utilizar la entrada de atrás del castillo, debe de ser sólo una invención de los músicos para hacer sentir a los que no lo son como unos ineptos. Las cinco notas adicionales tienen nombres compuestos, como «mi bemol» y «fa sostenido». No hay ninguna razón para que el sistema tenga que ser tan complicado, pero es el sistema que tenemos.
Se aclara un poco la cuestión si examinamos el teclado de un piano. Hay en él teclas blancas y teclas negras espaciadas en un orden irregular: unas veces hay dos teclas blancas adyacentes, y otras veces tienen entre ellas una tecla negra. Sean las teclas blancas o negras, la distancia perceptual de una tecla adyacente a la siguiente siempre es de un semitono, y una distancia de dos teclas es siempre un paso completo o tono. Esto se aplica a muchos instrumentos occidentales; la distancia entre un traste de una guitarra y el siguiente es también un semitono, y al presionar o soltar teclas adyacentes en instrumentos de viento de madera (como el clarinete o el oboe) cambia característicamente el tono en un semitono.
Las teclas blancas se llaman A, B, C, D, E, F y G. Las notas intermedias (las teclas negras) son las que tienen nombres compuestos. La nota entre A y B se llama bien A sostenido o bien B bemol, y, salvo en análisis o discusiones musicales teóricas oficiales, los dos términos son intercambiables. (De hecho, esta nota podría llamarse también C doble bemol y, del mismo modo, A podría llamarse G doble sostenido, pero éste es un uso aún más teórico.) Sostenido significa aguda o alta y bemol significa grave o baja. B bemol es la nota un semitono más baja que B; A sostenido es la nota un semitono más alta que A. En el sistema paralelo do-re-mi, marcan esos distintos tonos sílabas únicas: di y ra indican, por ejemplo, el tono entre do y re.
Las notas de nombres compuestos no son ni mucho menos ciudadanas musicales de segunda clase. Son igual de importantes, y algunas canciones y algunas escalas las utilizan de forma exclusiva. Por ejemplo, el principal acompañamiento de «Superstition» de Stevie Wonder sólo se toca con las teclas negras del teclado. Las doce teclas juntas, más sus primas repetidas con una o más octavas de separación, son los componentes básicos fundamentales de la melodía, en todas las canciones de nuestra cultura. Todas las canciones que conoces, desde «Deck the Halls» a «Hotel California», desde «Ba Ba Black Sheep» al tema de Sexo en Nueva York, están compuestas combinando estos doce tonos y sus octavas.
Para aumentar la confusión, los músicos utilizan también los términos bemol y sostenido para indicar si alguien está desentonando; si el músico toca la nota un poco demasiado alta (pero no tanto como para hacer la nota siguiente de la escala) decimos que la nota que se está tocando es sostenida, y si el músico toca la nota demasiado baja decimos que la nota es bemol. Por supuesto, un músico puede estar desentonando sólo ligeramente y nadie se daría cuenta. Pero cuando el músico desentona más (digamos que de un cuarto a un medio de la distancia entre la nota que estaba intentando tocar y la siguiente) la mayoría podemos normalmente darnos cuenta. Esto se nota sobre todo cuando hay más de un instrumento tocando y la nota desentonada que oímos choca con las que están tocando simultáneamente los otros músicos.
Los nombres de los tonos están asociados con valores de frecuencia concretos. Nuestro sistema actual se llama A440 porque la nota que llamamos A, que está en medio del teclado del piano, se ha fijado para tener una frecuencia de 440 hercios, lo cual es del todo arbitrario. Podemos fijar A a cualquier frecuencia, por ejemplo a 439, 444, 424 o 314.159; en la época de Mozart se utilizaron unidades diferentes a las de hoy. Algunas personas afirman que las frecuencias han de ser exactas, porque afectan al sonido global de una pieza musical y al sonido de los instrumentos. Led Zeppelin solían afinar sus instrumentos sin atenerse a la medida moderna A440 para dar a su música un sonido especial, y quizá para vincularla con las canciones populares infantiles de Europa que inspiraron muchas de sus composiciones. Hay puristas que insisten en escuchar música barroca interpretada con instrumentos de la época, porque los instrumentos tienen un sonido diferente y también porque están diseñados para tocar la música en su afinación original, algo que los puristas consideran importante.
Podemos fijar los tonos donde queramos, porque lo que define la música es una serie de relaciones tonales. Las frecuencias específicas de las notas pueden ser arbitrarias, pero la distancia de una frecuencia a la siguiente (y por tanto de una nota a la siguiente en nuestro sistema musical) no lo es en absoluto. Cada nota de nuestro sistema musical está espaciada equitativamente para nuestro oído (no necesariamente para los oídos de otras especies). Aunque no haya ningún cambio equivalente en ciclos por segundo (hercios) cuando ascendemos de una nota a la siguiente, la distancia entre cada nota y la siguiente tiene un sonido equivalente. ¿Cómo puede ser esto? La frecuencia de cada nota en nuestro sistema es aproximadamente un seis por ciento mayor que la de la precedente. Nuestro sistema auditivo es sensible tanto a cambios relativos como a cambios proporcionales de sonido. Así, cada aumento de frecuencia del seis por ciento nos da la impresión de que hemos aumentado el tono igual que la última vez.
La idea de cambio proporcional se entiende mejor si pensamos en pesos. Si vas a un gimnasio y quieres aumentar el peso que levantas y pasar de las pesas de 2 kilos a las de 20, con 2 kilos más por semana no conseguirás una equivalencia en la cantidad de peso levantado. Cuando después de una semana levantando 2 kilos pases a 4, estarás duplicando el peso; la semana siguiente, cuando pases a 6, será una vez y media más el peso que levantabas antes. Un espaciado equivalente (para dar a tus músculos un incremento de peso similar cada semana) consistiría en añadir un porcentaje constante del peso de la semana anterior en cada aumento. Por ejemplo, podrías decidir añadir un cincuenta por ciento cada semana, y pasarías entonces de 2 kilos a 3, luego a 4,5, luego a 6,25 y así sucesivamente. El sistema auditivo funciona del mismo modo, y por esa razón nuestra escala está basada en una proporción: cada nota es un seis por ciento más alta que la anterior, y al aumentar un seis por ciento en cada paso doce veces, acabamos duplicando la frecuencia original (la proporción concreta es la raíz 12 de dos=1,059463...).
Las doce notas de nuestro sistema musical se denominan escala cromática. Una escala es simplemente un conjunto de tonos musicales que han sido elegidos para ser diferenciables entre sí y para ser utilizados como base en la construcción de melodías.
En la música occidental raras veces utilizamos todas las notas de la escala cromática para componer; utilizamos en realidad un subconjunto de siete (o con menos frecuencia, cinco) de esas doce notas. Cada uno de esos subconjuntos es en sí mismo una escala, y el tipo de escala que utilizamos influye mucho en el sonido global de una melodía, y en sus cualidades emotivas. El subconjunto más común de siete notas utilizado en la música occidental se denomina la escala mayor, o modo jónico (un reflejo de sus antiguos orígenes griegos). Como todas las escalas, puede empezar en cualquiera de las doce notas, y lo que la define no es la pauta específica o relación de distancia entre cada nota y la siguiente. En toda escala mayor, la pauta de intervalos (distancias tonales entre tonalidades sucesivas) es: tono entero, tono entero, semitono, tono entero, tono entero, tono entero, semitono.
Las notas de la escala mayor son, empezando en do, do-re-mi-fa-sol-la-si-do, todas notas blancas en el teclado del piano. Las demás escalas mayores exigen una o más notas negras para mantener la pauta tono entero/semitono necesaria. El tono inicial se llama también tónica de la escala.
El emplazamiento concreto de los dos semitonos de la secuencia de la escala mayor es crucial; no se trata sólo de que defina la escala mayor y la diferencie de las otras escalas, sino que es un ingrediente importante de expectativas musicales. Los experimentos han demostrado que tanto los niños pequeños como los adultos aprenden y memorizan mucho mejor melodías extraídas de escalas con distancias desiguales como ésta. La presencia de los dos semitonos, y sus posiciones concretas, orientan al oyente aculturado y experimentado hacia dónde estamos en la escala. Todos somos expertos en saber, cuando oímos un si en la tonalidad de do (es decir, cuando los tonos se están extrayendo primariamente de la escala do mayor) que es la séptima nota (o «grado») de esa escala, y que está a sólo un semitono por debajo de la sensible, aunque la mayoría de nosotros no sepamos nombrar las notas, y puede que no sepamos siquiera lo que es un grado de escala o una tónica. Hemos asimilado la estructura de esta escala y de otras al oír música y exponernos de forma pasiva (más que guiados teóricamente) a ella a lo largo de nuestra vida. No se trata de un conocimiento innato, sino que se adquiere a través de la experiencia. Tampoco necesitamos aprender cosmología para saber que el sol sale todas las mañanas y se oculta por la noche: hemos aprendido esa secuencia de acontecimientos a través de una exposición primordialmente pasiva a ellos.
Diferentes pautas de tonos y semitonos dan origen a escalas alternativas, la más común de las cuales (en nuestra cultura) es la escala en modo menor. Hay una escala en modo menor que, como la escala en do mayor, utiliza sólo las notas blancas del teclado del piano: la escala en la menor. Los tonos para esa escala son la - si - do - re - mi - fa - sol - la. (Porque utiliza el mismo conjunto de tonos, pero en un orden diferente, la menor se dice que es la «escala relativa menor de la escala en do mayor».) La pauta de tonos enteros y medios tonos es diferente de la escala en modo mayor: entero - medio - entero - entero - medio - entero - entero. Fíjate en que la ubicación de los semitonos es muy diferente que en la escala mayor; en las escalas en modo mayor, hay un semitono justo antes de la tónica que «lleva» a la tónica, y otro justo antes del cuarto grado de la escala. En la escala menor, los semitonos están antes del tercer grado de la escala y antes del sexto. Hay aún un impulso cuando estamos en esta escala de volver a la raíz, pero los acordes que crea este impulso tienen una trayectoria emotiva y un sonido muy distintos.
Ahora podrías muy bien preguntar: si estas dos escalas utilizan exactamente el mismo conjunto de tonos, ¿cómo sé en cuál estoy? Si un músico está tocando las teclas blancas, ¿cómo sé si está tocando la escala de la menor o la escala de do mayor? La respuesta es que (sin que tengamos conciencia de ello) nuestros cerebros están siguiendo el rastro de cuántas veces se tocan notas concretas, dónde aparecen en forma de compases fuertes frente a débiles y cuánto duran. El cerebro deduce a través de un proceso cognitivo en qué tonalidad están basándose esas propiedades. Éste es otro ejemplo de algo que la mayoría de nosotros podemos hacer incluso sin formación musical, y sin lo que los psicólogos llaman conocimiento declarativo: la capacidad de hablar sobre ello; pero a pesar de nuestra falta de educación musical formal, sabemos qué fue lo que el compositor se propuso utilizar como centro tonal, o tonalidad, de la pieza, y nos damos cuenta de cuándo nos hace volver a la tónica, o de cuándo deja de hacerlo. El medio más simple de establecer una tonalidad es, pues, tocar la tónica varias veces, tocarla alto, y tocarla larga. E incluso si un compositor piensa que está componiendo en do mayor, si hace a los músicos tocar la nota la una y otra vez, tocarla alto y tocarla largo; si el compositor empieza la pieza en un la y la termina en un la, y si evita, además, el uso de do, lo más probable es que la audiencia, los músicos y los teóricos musicales decidan que la pieza está en la menor, aunque ése no fuese el propósito del compositor. En las tonalidades musicales, como en las multas por exceso de velocidad, lo que cuenta es lo que se ha hecho, no la intención.
Por razones que son principalmente culturales, tendemos a asociar las escalas en modo mayor con emociones felices o triunfales, y las compuestas en modo menor con emociones de tristeza o de derrota. Algunos estudios han indicado que esas asociaciones podrían ser innatas, pero el hecho de que no sean culturalmente universales indica, como mínimo, que cualquier tendencia innata puede ser superada por exposición a asociaciones culturales específicas. La teoría musical de Occidente reconoce tres escalas en modo menor y cada una de ellas tiene un sabor algo distinto. El blues suele utilizar una escala de cinco notas (pentatónica) que es un subgrupo de la escala en modo menor, y la música china utiliza una escala pentatónica diferente. Cuando Tchaikovsky quiere que pensemos en la cultura árabe o china en el ballet Cascanueces, elige escalas que son típicas de sus músicas, y en sólo unas notas nos transporta a Oriente. Cuando Billie Holiday quiere dar un tono de blues a una melodía estándar, invoca la escala del blues y canta notas de una escala que no estamos acostumbrados a oír en la música clásica estándar.
Los compositores conocen estas asociaciones y las utilizan de forma intencionada. Nuestros cerebros también las conocen, a través de una vida de exposición a idiomas, pautas, escalas, letras musicales y asociaciones entre ellos. Cada vez que oímos una pauta musical que es nueva para nuestros oídos, el cerebro intenta realizar una asociación a través de las claves visuales, auditivas o sensoriales de otro género que puedan acompañarla; procuramos contextualizar los nuevos sonidos y acabamos creando esos vínculos memorísticos entre un conjunto determinado de notas y un lugar determinado o una época o un conjunto de acontecimientos. Nadie que haya visto Psicosis de Hitchcok puede oír los chirriantes violines de Bernard Hermann sin pensar en la escena de la ducha; cualquiera que haya visto alguna vez una película de dibujos animados de «Merrie Melody» de Warner Brothers pensará en un personaje subiendo escaleras serpenteantes siempre que oiga punteo de violines en una escala mayor ascendente. Las asociaciones son lo bastante poderosas (y las escalas lo bastante diferenciables) para que sólo hagan falta unas cuantas notas: las tres primeras de «China Girl» de David Bowie o «La gran puerta de Kiev» (de Cuadros de una exposición) de Mussorgsky transmiten de manera instantánea un contexto musical rico y (para nosotros) extranjero.
Casi toda esta variación de contexto y de sonido procede de formas diferentes de dividir la octava y, en casi todos los casos que conocemos, de dividirla en no más de doce notas. Se ha afirmado que la música india y la árabe-persa utilizan «microtonalidad» (escalas con intervalos mucho más pequeños que un semitono), pero un análisis detenido revela que sus escalas se basan también en doce notas o menos y las otras son simplemente variaciones expresivas, glissandos (deslizamientos continuos de una nota a otra), y notas rápidas de pasada, similares a la tradición del blues americano de deslizarse en una nota con propósitos emotivos.
En toda escala existe una jerarquía de importancia entre las notas; algunas son más estables, con un sonido estructuralmente más significativo, o más decisivo que otras, y nos hacen sentir intensidades distintas de tensión y resolución. En la escala mayor, la nota más estable es el primer grado, llamado también la tónica. En otras palabras, todas las otras notas de la escala parecen apuntar hacia la tónica, pero apuntan con un impulso variable. La nota que lo hace con más fuerza es el grado séptimo de la escala, si en una escala en do mayor. La nota que apunta con menos fuerza hacia la tónica es el grado quinto de la escala, sol en do mayor, y apunta con menos fuerza porque se percibe como relativamente estable; esto es sólo otra forma de decir que nos sentimos incómodos (indecisos) si una canción acaba en el grado quinto de la escala. La teoría de la música especifica esta jerarquía tonal. Carol Krumhansl y sus colegas mostraron en una serie de estudios que los oyentes ordinarios han incorporado los principios de esta jerarquía en el cerebro, a través de la exposición pasiva a las normas culturales y musicales. Pidiendo a la gente que valorara lo bien que parecían ajustarse las diferentes notas con una escala que ella tocaba, extrajo de sus juicios subjetivos la jerarquía teórica.
Un acorde es simplemente un grupo de tres o más notas tocadas al mismo tiempo. Se extraen en general de una de las tres escalas que se utilizan habitualmente, y las tres notas se eligen de modo que transmitan información sobre la escala de la que se toman. Un acorde característico se construye tocando las notas primera, tercera y quinta de una escala simultáneamente. Como la secuencia de tonos y semitonos es diferente para las escalas menores y mayores, los tamaños de los intervalos son diferentes para acordes tomados de este modo de las dos diferentes escalas. Si construimos un acorde empezando en do y utilizamos los tonos de la escala do mayor, utilizamos do, mi y sol. Si utilizamos la escala do menor, las notas primera, tercera y quinta son do, mi bemol y sol. Esa diferencia en el tercer grado, entre mi y mi bemol, hace que el propio acorde pase de mayor a menor. Todos nosotros, incluso careciendo de formación musical, podemos apreciar la diferencia entre esos dos acordes aunque no dispongamos de la terminología necesaria para designarlos; el acorde mayor nos parece feliz y el menor, triste, o reflexivo, o incluso exótico. Las canciones más básicas de música country y del rock utilizan sólo acordes mayores: «Johnny B. Good», «Blowin’ in the Wind», «Honky Tonk Women» y «Mammas Don’t Let Your Babies Grow Up to Be Cowboys», por ejemplo.
Los acordes menores añaden complejidad; en «Light My Fire» de los Doors, las estrofas se interpretan en acordes menores («You know that it would be untrue...») y luego el coro en acordes mayores («Come on baby, light my fire»). En «Jolene» Dolly Parton mezcla acordes menores y mayores para conseguir un sonido melancólico. «Sheep» (del álbum Animals) de Pink Floyd utiliza sólo acordes menores.
Los acordes, como las notas individuales de la escala, se distribuyen también en una jerarquía de estabilidad que depende del contexto. Ciertas progresiones de acordes son parte de cada tradición cultural, y la mayoría de los niños, incluso a los cinco años de edad, han interiorizado reglas sobre las sucesiones de acordes que son legales en la música de su cultura, o características de ella; pueden detectar rápidamente desviaciones de las secuencias estándar con la misma facilidad con que nosotros podemos detectar cuándo una frase está mal formada, como por ejemplo: «La pizza estaba demasiado caliente para dormir». Para que el cerebro consiga eso, tiene que haber redes de neuronas que formen representaciones abstractas de la estructura musical y de las reglas musicales, algo que hacen automáticamente y sin nuestro conocimiento consciente. Cuando el cerebro es joven es más receptivo (casi como una esponja) y absorbe con avidez todos y cada uno de los sonidos que puede y los incorpora a la estructura de su cableado neuronal. Al hacernos mayores, esos circuitos neuronales son algo menos maleables, y resulta ya más difícil incorporar, a un nivel neuronal profundo, nuevos sistemas musicales, o incluso nuevos sistemas lingüísticos.
El asunto del tono se hace ahora algo más complicado, y la culpa de todo la tiene la física. Pero esta complicación da origen al rico espectro de sonidos que producen los diferentes instrumentos. Todos los objetos naturales del mundo tienen varias formas de vibración. La cuerda de un piano vibra en realidad a varias velocidades diferentes al mismo tiempo. Lo mismo sucede con la campana que golpeamos con un martillo, los tambores que golpeamos con las manos o las flautas en las que soplamos aire: las moléculas de aire vibran a varias velocidades simultáneamente, no a una velocidad única.
Una analogía son los diversos tipos de movimientos de la Tierra que se producen a la vez. Sabemos que la Tierra gira sobre su eje una vez cada veinticuatro horas, que viaja alrededor del Sol una vez cada 365,25 días y que todo el sistema solar está girando con la galaxia de la Vía Láctea. Son varios tipos de movimientos y se producen todos al mismo tiempo. Otra analogía son los muchos modos de vibración que percibimos a menudo cuando vamos en tren. Imagina que estás sentado en un tren en una estación en el campo, con la locomotora parada. Sopla viento y sientes que el vagón se balancea hacia delante y hacia atrás un poquito sólo. Lo hace con una regularidad que puedes determinar con un cronómetro manual, y calculas que el tren se mueve hacia delante y hacia atrás unas dos veces por segundo. Luego, el maquinista pone en marcha la locomotora y sientes un tipo diferente de vibración a través del asiento (se debe a las oscilaciones del motor: los pistones y el cigüeñal que giran a una velocidad determinada). Cuando el tren empieza a moverse, experimentas una tercera sensación, el golpeteo de las ruedas cada vez que pasan por un empalme de la vía. Experimentas en total varios tipos diferentes de vibraciones, todos ellos probablemente a velocidades o frecuencias distintas. Cuando el tren se pone en marcha, percibes con claridad una vibración. Pero es muy difícil, y hasta imposible, que aprecies cuántas vibraciones se producen y la velocidad de cada una. Utilizando instrumentos de medición especializados, sin embargo, se podrían apreciar.
Cuando producimos un sonido en un piano, una flauta o cualquier otro instrumento (incluidos los de percusión, como tambores y cencerros) generamos muchos modos de vibración que ocurren simultáneamente. Cuando escuchas una sola nota ejecutada en un instrumento, estás oyendo en realidad muchísimos tonos al mismo tiempo, no un tono único. La mayoría no nos damos cuenta de esto de forma consciente, aunque algunas personas pueden aprender a oírlos. El que tiene la velocidad de vibración más lenta (el tono más bajo) se denomina frecuencia fundamental, y los otros se denominan colectivamente armónicos.
Recapitulando, es una propiedad de los objetos del mundo el que vibren generalmente a varias frecuencias distintas a la vez. Lo asombroso es que esas otras frecuencias suelen estar relacionadas entre sí matemáticamente de una forma muy simple: como múltiplos enteros. Así que si pulsas una cuerda y su frecuencia de vibración más lenta es de un centenar de veces por segundo, las otras frecuencias vibratorias serán 2 x 100 (200 hercios), 3 x 100 (300 hercios), etc. Si soplas en una flauta o en una grabadora y generas vibraciones a 310 hercios, se producirán vibraciones adicionales del doble, el triple, el cuádruple, etc., de esa frecuencia: 620 hercios, 930 hercios, 1.240 hercios, y así sucesivamente. Cuando un instrumento crea energía a frecuencias que son múltiples enteros como en este caso, decimos que el sonido es armónico, y denominamos la pauta de energía a diferentes frecuencias la serie armónica. Hay pruebas de que el cerebro reacciona a esos sonidos armónicos con activaciones neuronales sincrónicas, y las neuronas del córtex auditivo reaccionan a cada uno de los componentes del sonido sincronizando entre sí su velocidad de activación y creando una base neuronal para la cohesión de esos sonidos.
El cerebro está tan sintonizado con la serie armónica que si nos encontramos con un sonido que tiene todos los componentes excepto el fundamental, el cerebro lo llena por nosotros en un fenómeno denominado «restauración de la fundamental ausente». Un sonido compuesto de energía a 100 hercios, 200 hercios, 300 hercios, 400 hercios y 500 hercios se percibe como si tuviese una altura de tono de 100 hercios, su frecuencia fundamental. Pero si creamos artificialmente un sonido con energía a 200 hercios, 300, 400 y 500 (dejando fuera el fundamental) lo percibiremos de todos modos como si tuviese una altura de tono de 100 hercios. No lo percibimos como si tuviese un tono de 200 hercios porque nuestro cerebro «sabe» que un sonido armónico normal con un tono de 200 hercios tendría una serie armónica de 200 hercios, 400, 600, 800, etc. Podemos engañar también al cerebro ejecutando secuencias que se desvíen de la serie armónica como esta: 100 hercios, 210, 302, 405, etc. En esos casos, el tono que se percibe se aparta de los 100 hercios en una solución de compromiso entre lo que se presenta y lo que sería una serie armónica normal.
Cuando era un estudiante de licenciatura, mi tutor, Mike Posner, me habló del trabajo de un estudiante de posgrado de biología, Petr Janata. Aunque no se había criado en San Francisco, Petr tenía el pelo largo y abundante como yo y lo llevaba recogido en una cola de caballo, tocaba al piano jazz y rock y vestía con prendas de esas que se tiñen atadas: una verdadera alma gemela. Petr colocó electrodos en el culículo inferior de unas lechuzas, que es parte de su sistema auditivo. Luego les puso una versión de «El vals del Danubio azul» de Strauss, compuesto de notas de las que se había eliminado la frecuencia fundamental. Su hipótesis era que si la fundamental ausente se restauraba a niveles iniciales del proceso auditivo, las neuronas del culículo inferior de la lechuza se activarían a la velocidad de esa fundamental ausente. Eso fue exactamente lo que descubrió. Y debido a que los electrodos emiten una pequeña señal eléctrica con cada activación (y como la «velocidad» de activación es la misma que una «frecuencia» de activación), Petr envió las señales de esos electrodos a un pequeño amplificador y repitió el sonido de las neuronas de la lechuza a través de un altavoz. Lo que oyó era asombroso; la melodía de «El vals del Danubio azul» cantada claramente a través de los altavoces: ba da da da da, dit dit, dit dit. Estábamos oyendo las velocidades de activación de las neuronas y eran idénticas a la frecuencia de la fundamental ausente. Las series armónicas tenían una ejemplificación no sólo en los niveles tempranos del procesamiento auditivo, sino en una especie completamente distinta.
Podemos imaginar una especie alienígena que no tenga oídos, o que no tenga la misma experiencia interior de oír que nosotros. Pero sería difícil imaginar una especie avanzada que no tuviese absolutamente ninguna posibilidad de percibir las vibraciones de los objetos. Donde hay atmósfera hay moléculas que vibran en respuesta al movimiento. Y saber si algo está generando ruido o avanzando hacia nosotros o alejándose de nosotros, aun en el caso de que no podamos verlo (porque está oscuro, porque nuestros ojos no están atendiendo a ello, porque estamos dormidos) tiene un gran valor de supervivencia.
Como la mayoría de los objetos físicos hacen vibrar a las moléculas de varios modos al mismo tiempo, y como en muchos, muchísimos objetos esos modos mantienen entre sí relaciones de enteros simples, la serie armónica es un hecho real de este mundo que esperamos hallar en todas partes a las que miremos: en Norteamérica, en las islas Fiji, en Marte y en los planetas que orbitan Antares. Es probable que todo organismo que evolucione en un mundo con objetos que vibran (dado un período de tiempo evolutivo suficiente) haya desarrollado una unidad de procesamiento en el cerebro que incorpore esas regularidades de su mundo. Dado que el tono es una clave fundamental de la identidad de un objeto, deberíamos esperar encontrarnos con mapas tonotópicos como los que existen en el córtex auditivo humano, y activaciones neuronales sincrónicas para tonos que tienen entre ellos relaciones armónicas de octava y de otro tipo; esto ayudaría al cerebro (alienígena o terrestre) a deducir que todos estos sonidos probablemente proceden del mismo objeto.
Para referirse a los armónicos suelen utilizarse números: el primer armónico es la primera frecuencia de vibración por encima de la fundamental, el segundo armónico es la segunda frecuencia de vibración por encima de la fundamental, etc. No todos los instrumentos vibran de modos tan nítidamente definidos. A veces, como sucede con el piano (porque es un instrumento percusivo), los armónicos pueden estar próximos a ser múltiplos exactos de la frecuencia fundamental pero no llegar a serlo, y esto contribuye a su sonido característico. Los instrumentos de percusión, los carillones y otros objetos suelen tener (dependiendo de la composición y la forma) armónicos que no son claramente múltiples enteros del fundamental, y se les denomina armónicos parciales o inarmónicos. Los instrumentos con armónicos inarmónicos carecen en general del sentido claro del tono que asociamos con los instrumentos armónicos, y la base del córtex puede por ello no experimentar una activación neural sincrónica. Pero de todos modos tienen un sentido del tono, y esto podemos apreciarlo con total claridad cuando tocamos notas inarmónicas en sucesión. Aunque tal vez no podamos tararear con el sonido de una sola nota ejecutada en un bloque de madera chino o en un carillón, sí podemos interpretar una melodía identificable en una serie de bloques de madera chinos o carillones, porque nuestro cerebro se centra en los cambios de los armónicos de uno a otro. Esto es básicamente lo que pasa cuando oímos a la gente interpretar una canción con los carrillos.
Una flauta, un violín, una trompeta y un piano pueden tocar el mismo tono, es decir, se puede escribir una nota en una partitura musical y cada instrumento tocará un tono con una frecuencia fundamental idéntica y nosotros oiremos (tenderemos a hacerlo) un tono idéntico. Pero todos estos instrumentos suenan de una forma muy distinta unos de otros.
Esta diferencia es el timbre, y es la característica más importante y ecológicamente más relevante de los fenómenos auditivos. El timbre de un sonido es la característica principal que diferencia el rugido de un león del ronroneo de un gato, el restallar del trueno del estrépito de las olas del mar, la voz de un amigo de la del cobrador de facturas al que uno está intentando eludir. La discriminación tímbrica es tan aguda en los humanos que la mayoría de nosotros podemos reconocer centenares de voces distintas. Podemos saber incluso si alguien próximo a nosotros (nuestra madre, nuestra esposa) es feliz o está triste, está sano o tiene un catarro, basándonos en el timbre de su voz.
El timbre es una consecuencia de los armónicos. Los diferentes materiales tienen diferentes densidades. Un trozo de metal tenderá a hundirse hasta al fondo de un estanque; un trozo de madera del mismo tamaño y de la misma forma flotará. Debido en parte a la densidad y en parte al tamaño y la forma, los diferentes objetos hacen también ruidos distintos cuando les das un golpe con la mano o un golpecito suave con un martillo. Imagina el sonido que oirías si le dieses un golpe con un martillo (¡suavemente, por favor!) a una guitarra: sería un plunk hueco a madera. O si el golpe se lo dieses a una pieza de metal, como un saxofón: sería un pequeño plink. Cuando golpeas esos objetos, la energía del martillo hace vibrar las moléculas dentro de ellos, que bailan a varias frecuencias distintas, determinadas por el material del que está hecho el objeto, por su tamaño y por su forma. Si el objeto vibra a, por ejemplo, 100 hercios, 200, 300, 400, etc., la intensidad de la vibración no tiene que ser la misma para cada uno de estos armónicos, y de hecho lo característico es que no lo sea.
Cuando oyes un saxofón tocando una nota con una frecuencia fundamental de 220 hercios, estás oyendo en realidad muchas notas, no sólo una. Las otras notas que oyes son de múltiples enteros de la fundamental: 440, 660, 880, 1200, 1420, 1540, etc. Estas notas diferentes (los armónicos) tienen diferentes intensidades, y por eso nos parece al oírlas que tienen un volumen sonoro distinto. La pauta concreta de volumen sonoro para esas notas es distintiva del saxofón, y son ellas las que dan origen a su color tonal único, a su sonido único: su timbre. Un violín que toque la misma nota escrita (220 hercios) producirá armónicos de las mismas frecuencias, pero el volumen sonoro de cada uno de ellos respecto a los otros será diferente. De hecho, existe una pauta única de armónicos para cada instrumento. El segundo armónico podría ser en uno más fuerte que en otro, mientras que el quinto podría ser más suave. Prácticamente toda la variación tonal que oímos (la cualidad que otorga a una trompeta su «trompetidad» y que proporciona un piano su «pianez») procede de la forma peculiar en que están distribuidos los volúmenes sonoros de los armónicos.
Cada instrumento tiene su propio perfil armónico, que es como una huella dactilar. Se trata de una pauta compleja que podemos utilizar para identificar el instrumento. Los clarinetes, por ejemplo, se caracterizan por tener un grado relativamente alto de energía en los armónicos impares: tres veces, cinco veces y siete veces los múltiplos de la frecuencia fundamental, etc. (Esto se debe a que es un tubo cerrado por un extremo y abierto por el otro.) Las trompetas se caracterizan por tener un grado relativamente equilibrado de energía tanto en los armónicos pares como los impares (la trompeta, como el clarinete, está también cerrada en un extremo y abierta en el otro, pero la boquilla y el pabellón están diseñados para suavizar las series armónicas). Un violín al que se aplique el arco en el centro producirá primordialmente armónicos impares, y en consecuencia puede sonar de una forma parecida a un clarinete. Pero si se aplica el arco a un tercio de la parte baja, el instrumento resalta el tercer armónico y sus múltiples: el sexto, el noveno, el duodécimo, etc.
Todas las trompetas tienen una huella dactilar tímbrica, y se distingue fácilmente de la de un violín, la de un piano e incluso la de la voz humana. Para el oído experimentado, y para la mayoría de los músicos, existen diferencias incluso entre trompetas: no todas ellas suenan igual, ni todos los pianos ni todos los acordeones. (A mí los acordeones me suenan todos igual, y el sonido más dulce y placentero que puedo imaginar es el que harían todos ellos ardiendo en una hoguera gigantesca.) Lo que diferencia un piano concreto de otro es que sus perfiles armónicos diferirán ligeramente entre sí, aunque no, por supuesto, tanto como diferirán ambos del perfil de un clavicémbalo, un órgano o una tuba. Los buenos músicos pueden apreciar las diferencias entre un violín Stradivarius y un Guarneri después de oír una o dos notas. Yo puedo apreciar con claridad la diferencia entre mi guitarra acústica Martin 000-18 de 1956, mi Martin D-18 de 1973 y mi Collings D2H de 1996; suenan como instrumentos distintos, aunque son todas guitarras acústicas; nunca confundiría una con otra. Eso es el timbre.
Los instrumentos naturales (es decir, instrumentos acústicos hechos de materiales del mundo real como metal y madera) tienden a producir energía a varias frecuencias al mismo tiempo por el modo de vibrar de la estructura interna de sus moléculas. Supongamos que inventase un instrumento que, a diferencia de los instrumentos naturales que conocemos, produjese energía a una frecuencia y sólo a una. Llamemos a este instrumento hipotético generador (porque genera notas de frecuencias específicas). Si alinease un grupo de generadores, podría poner a cada uno de ellos a tocar una frecuencia específica correspondiente a la serie armónica de un instrumento determinado tocando una nota determinada. Podría tener un grupo de esos generadores emitiendo sonidos a 110, 220, 330, 440, 550 y 660 hercios, que darían la impresión al oyente de una nota de 110 hercios tocada por un instrumento musical. Además, podría controlar la amplitud de cada uno de mis generadores y hacer que cada una de las notas se tocase con una intensidad determinada, que correspondiese al perfil armónico de un instrumento musical natural. Si hiciese eso, el grupo de generadores resultante se aproximaría al sonido de un clarinete, una flauta o cualquier otro instrumento que yo estuviese intentando emular.
Con una síntesis aditiva así conseguiría una versión sintética de un timbre de instrumento musical agrupando componentes sónicos elementales del sonido. Muchos órganos de tubos, como los que hay en las iglesias, tienen una característica que permite comprobar esto. En la mayoría de los órganos de tubos se aprieta una tecla (o un pedal), que envía un chorro de aire a través de un tubo de metal. El órgano consta de centenares de tubos de tamaños distintos, y cada uno produce un tono diferente, en correspondencia a su tamaño, cuando se lanza aire a través de él; pueden concebirse como flautas mecánicas, en las que un motor eléctrico suministra el aire. El sonido que asociamos con un órgano de iglesia (su timbre particular) se debe a que se produce energía a varias frecuencias distintas al mismo tiempo, como en otros instrumentos. Cada tubo del órgano produce una serie armónica, y cuando se pulsa una tecla en el teclado del órgano, se dispara una columna de aire a través de más de un tubo al mismo tiempo, generando un espectro muy rico de sonidos. Esos tubos suplementarios, además del que vibra a la frecuencia fundamental de la nota que se está intentando tocar, producen notas que son múltiplos enteros de la frecuencia fundamental, o que tienen una estrecha relación matemática y armónica con ella.
El organista decide, como es lógico, por cuál de esos tubos suplementarios quiere que pase el aire accionando y activando palancas o tiradores que dirigen el flujo de aire. Un buen organista, sabiendo que los clarinetes tienen mucha energía en los armónicos impares de la serie armónica, podría simular el sonido de un clarinete manipulando tiradores de manera que recreasen la serie armónica de ese instrumento. Un poquito de 220 hercios aquí, una pincelada de 330 hercios, una gota de 440, una buena ración de 550 y voilà!..., ha cocinado un facsímil razonable de un instrumento.
A partir de finales de la década de los cincuenta los científicos empezaron a experimentar integrando esas capacidades de síntesis en instrumentos electrónicos más pequeños y compactos, y crearon una familia de nuevos instrumentos musicales conocidos comunmente como sintetizadores. En la década de los sesenta se oyeron sintetizadores en discos de los Beatles (en «Here Comes the Sun» y «Maxwell’s Silver Hammer») y de Walter/Wendy Carlos (Switched-On Bach), y luego en grupos que esculpían su sonido en torno al sintetizador, como Pink Floyd y Emerson, Lake and Palmer.
Muchos de esos sintetizadores utilizaban síntesis aditivas como la descrita aquí, y más tarde pasaron a utilizar algunos algoritmos más complejos, como la síntesis de guía de ondas (inventada por Julius Smith en Stanford) y la síntesis de frecuencia modulada (inventada por John Chowning, también en Stanford). Pero limitarse a copiar el perfil armónico, cuando se puede crear un sonido que recuerde al del instrumento real, proporciona una copia bastante pobre. En el timbre hay algo más que la serie armónica. Los investigadores aún discuten sobre lo que es ese «algo más», pero se acepta en general que, además del perfil armónico, definen el timbre otros dos atributos que dan origen a una diferencia perceptiva entre un instrumento y otro: ataque y flujo.
La Universidad de Stanford se halla en una extensión bucólica de tierra situada justo al sur de San Francisco y al este del océano Pacífico. Hacia el oeste se extienden colinas onduladas cubiertas de hierba y a sólo una hora en dirección este se encuentra el fértil Central Valley de California, donde se producen buena parte de las uvas pasas, el algodón, las naranjas y las almendras del mundo. Hacia el sur, cerca de la población de Gilroy, hay grandes campos de ajo. También hacia el sur está Castroville, conocida como la «capital del mundo de la alcachofa». (Yo propuse una vez a la Cámara de Comercio de Castroville que cambiasen lo de «capital» por «corazón». La propuesta no provocó demasiado entusiasmo.)
Stanford se ha convertido en una especie de segundo hogar para los ingenieros y científicos informáticos que aman la música. John Chowning, que era famoso como compositor de vanguardia, ocupa allí una cátedra en el departamento de música desde los años setenta, y figuró en un grupo de compositores pioneros de la época que utilizaban el ordenador para crear, almacenar y reproducir sonidos en sus composiciones. Más tarde se convirtió en director y fundador del Centro de Investigación Informática de Música y Acústica, conocido por sus siglas en inglés como CCRMA (se pronuncia CAR-ma; los que pertenecen a él dicen bromeando que la primera c es muda). Chowning es un hombre amistoso y cordial. Cuando yo era estudiante en Stanford, me ponía una mano en el hombro y me preguntaba en qué estaba trabajando. Tenía esa sensación de que hablar con un estudiante era para él una oportunidad de aprender algo. Al principio de los años setenta, mientras trabajaba con el ordenador y con ondas sinusoidales (el tipo de sonidos artificiales que se producen con ordenadores y que se utilizan para construir bloques de síntesis aditiva) se dio cuenta de que al cambiar la frecuencia de esas ondas al tocarlas creaba sonidos musicales. Controlando esos parámetros, podía simular los sonidos de una serie de instrumentos musicales. Esta nueva técnica pasaría a conocerse como síntesis de frecuencia modulada, o síntesis FM, y se incorporó por primera vez en la serie Yamaha DX9 y DX7 de sintetizadores, que revolucionó la industria de la música desde el momento en que se introdujeron en 1983. La síntesis de FM democratizó la síntesis musical. Antes de ella, los sintetizadores eran caros, toscos y difíciles de controlar. Crear nuevos sonidos lleva mucho tiempo, hay que experimentar mucho y hay que tener conocimientos prácticos. Pero con la FM, cualquier músico podía obtener un sonido instrumental convincente sólo con tocar un botón. Los escritores de canciones y los compositores que no podían permitirse contratar a una sección de viento de una orquesta podían ya trabajar con esas texturas y esos sonidos. Compositores y orquestadores podían ensayar arreglos antes de ocupar el tiempo de una orquesta entera para ver lo que funcionaba y lo que no. Las bandas New Wave, como los Cars y los Pretenders, así como artistas como Stevie Wonder, Hall and Oates y Phil Collins, empezaron a utilizar ampliamente la síntesis FM en sus grabaciones. Mucho de lo que consideramos «el sonido de los ochenta» en la música popular debe su carácter distintivo al sonido concreto de la síntesis de FM.
Con la popularización de la FM llegó una corriente constante de ingresos de derechos que permitieron a Chowning crear el CCRMA, atrayendo a estudiantes graduados y docentes reconocidos. Entre las primeras de las muchas celebridades famosas de la música electrónica y de la psicología de la música que acudieron al CCRMA estaban John R. Pierce y Max Mathews. Pierce había sido vicepresidente de investigación de los laboratorios de Bell Telephone de Nueva Jersey, y había supervisado al equipo de ingenieros que construyeron y patentaron el transistor (y fue precisamente él quien puso nombre al nuevo artilugio: TRANSfer resISTOR). En su distinguida carrera, se le atribuyó también la invención del tubo de vacío de onda viajera y el lanzamiento del primer satélite de comunicaciones, Telstar. Era también un respetado escritor de ciencia ficción con el seudónimo de J. J. Coupling. Pierce creaba un entorno extraño en cualquier industria o laboratorio de investigación, en el que los científicos se sentían con permiso para hacer lo mejor que supiesen y en el que la creatividad se valoraba mucho. En esa época, la Bell Telephone Company/AT&T tenía el monopolio del servicio telefónico en los Estados Unidos y grandes fondos. Su laboratorio era una especie de terreno de juego para los mejores y más brillantes científicos, ingenieros e inventores del país. En la «caja de arena» de ese laboratorio, Pierce permitía a su gente ser creadora sin preocuparse por el balance final ni por la aplicación de sus ideas al comercio. Comprendía que sólo puede haber verdadera innovación cuando la gente no tiene que censurarse a sí misma y puede dejar que fluyan libres las ideas. Aunque sólo una pequeña proporción de esas ideas puedan ser prácticas y una proporción aún menor se conviertan en productos, esos productos serían innovadores, únicos y potencialmente muy rentables. En ese entorno surgió toda una serie de innovaciones, entre ellas lásers, ordenadores digitales y el sistema operativo Unix.
Yo conocí a Pierce en 1990, cuando tenía ya ochenta años y daba conferencias sobre psicoacústica en el CCRMA. Varios años más tarde, después de doctorarme y volver a Stanford, nos hicimos amigos y salíamos todos los miércoles a cenar y a hablar de la investigación. En una ocasión me pidió que le explicara el rock and roll, algo a lo que él nunca había prestado la menor atención y que no comprendía. Sabía de mi experiencia anterior en el negocio de la música, y me preguntó si podría acercarme a cenar a su casa una noche y tocar seis canciones que transmitiesen todo lo que era importante saber sobre el rock and roll. ¿Seis canciones para transmitir todo el rock? Yo no estaba seguro de poder reunir seis canciones que transmitiesen lo que eran los Beatles, no digamos ya todo el rock. La noche antes me llamó para explicarme que había oído a Elvis Presley, así que no necesitaba ya cubrir eso.
He aquí lo que llevé a aquella cena:
1) «Long Tall Sally», Little Richard
2) «Roll Over Beethoven», los Beatles
3) «All Along the Watchtower», Jimi Hendrix
4) «Wonderful Tonight», Eric Clapton
5) «Little Red Corvette», Prince
6) «Anarchy in the UK», los Sex Pistols
En un par de las piezas elegidas combinaban grandes autores de canciones con intérpretes distintos. Todas son grandes canciones, pero incluso ahora me gustaría hacer algunos ajustes. Pierce escuchaba y preguntaba continuamente quién era aquella gente, qué instrumentos estaba oyendo y cómo podían sonar como sonaban. Dijo que lo que más le gustaba eran los timbres de la música. Las canciones en sí y los ritmos no le interesaban tanto, pero los timbres le parecieron sorprendentes: nuevos, extraños y excitantes. El fluido romanticismo del solo de guitarra de Clapton en «Wonderful Tonight», junto con una batería blanda y amortiguada. La fuerza pura y la densidad de la pared de ladrillo de guitarras y bajo y batería de los Sex Pistols. El sonido distorsionado de una guitarra eléctrica no era nada nuevo para Pierce. Lo que era nuevo para él era aquel modo en que los instrumentos se combinaban para crear un todo unificado (bajo, batería, guitarras eléctrica y acústica, voz). Para Pierce lo que definía el rock era el timbre. Y eso fue una revelación para ambos.
Las alturas de tono que utilizamos en música (las escalas) se han mantenido básicamente invariables desde la época de los griegos, con la excepción del desarrollo (en realidad un perfeccionamiento) de la escala temperada unificada en la época de Bach. El rock puede ser la etapa final en una revolución musical de un milenio de duración que dio a las quintas y cuartas perfectas una prominencia que históricamente sólo se había otorgado a la octava. En ese período, la música occidental estuvo dominada principalmente por el tono. Durante los últimos doscientos años, ha ido cobrando cada vez más importancia el timbre. Una práctica habitual de la música común a todos los géneros es repetir una melodía utilizando diferentes instrumentos: desde la Quinta de Beethoven y el Bolero de Ravel a «Michelle» de los Beatles y «All My Ex’s Live in Texas» de George Strait. Se han inventado nuevos instrumentos musicales para que los compositores pudiesen tener una paleta mayor de colores tímbricos con los que trabajar. Cuando un cantante de música country o de música popular deja de cantar y toma la melodía otro instrumento (incluso sin introducir ningún cambio en ella) nos resulta agradable la repetición de la misma melodía con un timbre distinto.
El compositor de vanguardia Pierre Schaeffer realizó en la década de los cincuenta sus famosos experimentos de la «campana cortada» que fueron cruciales y que demostraron un importante atributo del timbre. Grabó una serie de instrumentos orquestales en cinta. Luego, utilizando una hoja de afeitar, cortó el principio de esos sonidos. Esta primera parte inicial del sonido de un instrumento musical se llama ataque; es el sonido del golpe inicial, el rasgueo, el soplo de aire primero que provoca que el instrumento suene.
El gesto que hace nuestro cuerpo para crear sonido con un instrumento tiene una influencia importante en el sonido que éste produce. Pero ese efecto desaparece casi por completo tras los primeros segundos. Casi todos los gestos que hacemos para producir un sonido son impulsivos, entrañan explosiones breves y puntuales de actividad. En los instrumentos de percusión, lo característico es que el músico no se mantiene en contacto con el instrumento después de este impulso inicial. En los instrumentos de viento y los de arco, sin embargo, continúa en contacto con el instrumento después del acto impulsivo inicial: el momento en que el soplo de aire sale de la boca o el arco entra en contacto con la cuerda; el soplo y el movimiento del arco que siguen tienen un carácter más continuo y suave y menos impulsivo.
La introducción de energía en un instrumento (la fase de ataque) crea normalmente energía a muchas frecuencias distintas que no están relacionadas entre sí por simples múltiples enteros. En otras palabras, durante el breve período que sigue a nuestra acción de golpear, soplar, rasguear o hacer otra cosa que provoque que un instrumento empiece a sonar, el impacto mismo tiene una cualidad bastante ruidosa que no es especialmente musical, sino que se parece más al sonido de un martillo golpeando un trozo de madera, por ejemplo, que al de un martillo golpeando una campana o la cuerda un piano, o como el sonido del viento corriendo a lo largo de un tubo. Después del ataque hay una fase más estable en la que la nota musical adquiere una pauta ordenada de frecuencias armónicas al empezar a resonar el metal o la madera (u otro material) del que el instrumento esté compuesto. Esta parte media de una nota musical se denomina el estado estable... En la mayoría de los casos el perfil armónico es relativamente estable mientras el sonido emana del instrumento durante este período.
Después de eliminar el ataque de las grabaciones de instrumentos orquestales, Schaeffer volvió a poner la cinta y descubrió que a la mayoría de la gente le resultaba casi imposible identificar el instrumento que sonaba. Sin el ataque, piano y campanas sonaban de una forma notoriamente distinta de los pianos y las campanas, y resultaban muy similares entre sí. Si se empalma el ataque de un instrumento en el estado estable, o cuerpo, de otro, se obtienen resultados diversos: en unos casos, se oye un instrumento híbrido ambiguo que suena más como el instrumento del que procede el arranque que del que procede el estado estable. Michelle Castellengo y otros han descubierto que se pueden crear de ese modo instrumentos completamente nuevos; por ejemplo, introduciendo un sonido de arco del violín en una nota de flauta se crea un sonido que se parece muchísimo al de un organillo callejero. Estos experimentos demostraron la importancia del ataque.
La tercera dimensión del timbre (flujo) se refiere a cómo el sonido cambia una vez iniciado. Los platillos o el gong tienen mucho flujo (su sonido cambia de forma espectacular a lo largo del curso temporal de duración) mientras que una trompeta tiene menos flujo: su tonalidad es más estable a medida que se desarrolla. Además, los instrumentos no suenan igual en todo su registro. Es decir, el timbre de un instrumento tiene un sonido distinto si se tocan notas altas o bajas. Cuando Sting se eleva hacia la cima de su registro vocal en «Roxanne» (The Police), su voz tensa y atiplada transmite un tipo de emoción que no puede conseguir en las partes más bajas de su registro, como cuando oímos en el verso inicial de «Every Breath You Take» un sonido anhelante más deliberado. La parte alta del registro de Sting nos suplica con urgencia cuando se tensan sus cuerdas vocales, la parte baja sugiere un dolor sordo que tenemos la sensación de que lleva padeciendo mucho tiempo, pero que aún no ha llegado al punto de ruptura.
El timbre es algo más que los diferentes sonidos que producen los instrumentos. Los compositores se valen de él en la composición; eligen instrumentos musicales (y combinaciones de ellos) para expresar determinadas emociones y para transmitir una sensación de atmósfera o ambiente. Pensemos en el timbre casi cómico del fagot de la Suite del cascanueces de Tchaikovsky cuando inicia la «danza china», y la sensualidad del saxofón de Stan Getz en «Here’s That Rainy Day». Cambia las guitarras eléctricas de «Satisfaction» de los Rolling Stones por un piano y tendrás algo completamente distinto. Ravel utilizó el timbre como un elemento compositivo en el Bolero, repitiendo el esquema una y otra vez con timbres diferentes; lo hizo después de sufrir una lesión cerebral que afectó a su capacidad para apreciar el tono. Cuando pensamos en Jimi Hendrix, lo que es probable que recordemos con más intensidad es el timbre de sus guitarras eléctricas y su voz.
Compositores como Scriabin y Ravel hablan de sus obras como pinturas sonoras, en las que las notas de las melodías son el equivalente del contorno y la forma, y el timbre equivale al uso del color y el sombreado. Varios cantantes populares (Stevie Wonder, Paul Simon y Lindsey Buckingham) también han descrito sus composiciones como cuadros sonoros, en los que el timbre desempeña un papel equivalente al que tiene el color en el arte visual, separando entre sí las formas melódicas. Pero una de las cosas que hace la música diferente de la pintura es que es dinámica, cambia a lo largo del tiempo, y lo que impulsa la música hacia delante son el ritmo y el compás. El ritmo y el compás son el motor que conduce casi toda la música, y es probable que fuesen los primeros elementos utilizados por nuestros ancestros para hacer protomúsica, una tradición todavía presente hoy en el uso tribal de los tambores y en los rituales de diversas culturas preindustriales. Aunque yo creo que el timbre es ahora el centro de nuestra valoración de la música, el ritmo ha mantenido un poder superior sobre los oyentes durante mucho más tiempo.