Se ha escrito ya mucho sobre la llamada guerra del volumen. Casi siempre ha sido desde un punto de vista técnico y abordando partes parciales del tema. Además sinceramente estoy un poco cansado de intentar explicar mi visión sobre este asunto a mis clientes, y para no tener que repetir una y otra vez el mismo discurso, me he propuesto escribir sobre ello en mi blog.
¿Por qué un tema que suena más fuerte que otro aparentemente suena mejor?
Ya en otro artículo de hace algunos años explicaba este fenómeno, así que lo que leeréis a continuación está extraído de él:
Un disco sobrecomprimido con unos niveles altísimos nos dará la sensación de que suena mejor que otro que mantiene la dinámica tan solo si hacemos una comparación A/B entre ellos, y tan solo nos dará esa sensación durante unos segundos, hasta que veamos que el tema musical no tiene sentido artístico. Esto se debe a que cualquier cosa a más volumen que otra va a sonarnos mejor. La razón de esto ha sido ampliamente estudiada en psicoacústica, y se debe a que el sistema auditivo humano no tiene una respuesta lineal, es decir, no oye todas las frecuencias de igual forma.
Este fenómeno se explica por medio de las curvas isofónicas. Se toma como referencia la sensación de sonoridad (volumen) que provoca en el oído un cierto nivel a la frecuencia de 1kHz, que es donde el sistema auditivo humano es más sensible. Luego se determina la cantidad de dB SPL (niveles de presión sonora) que se necesitaría en todas las demás frecuencias para provocar la misma sensación de sonoridad. Para ello se usan los fones. Por ejemplo, si tomamos los 0dB a 1kHz, que es justo el umbral por encima del cual el oído humano empieza a escuchar algo, vemos que mientras que una señal de 1kHz con 0dB SPL supone el umbral de audición, a 100Hz necesitaríamos un nivel de más de 35dB SPL para empezar a escuchar. Por tanto vemos que a frecuencias bajas y a frecuencias altas necesitamos mucho más nivel para tener la misma sensación de sonoridad que a frecuencias medias. Aparte de esto, vemos que a medida que los niveles van subiendo, las curvas isofónicas se van aplanando, lo que quiere decir que a medida que subimos los niveles las diferencias entre los niveles que necesitamos a bajas y a altas frecuencias para tener la misma sensación de sonoridad que a frecuencias medias se van reduciendo.
Ahora razonemos todo esto y veamos por qué es importante tenerlo bien claro. Imaginad que ponemos nuestro disco favorito en nuestro reproductor musical a un volumen bajo. Puesto que necesitamos mucho más nivel a frecuencias altas y bajas para tener la misma sensación de sonoridad, probablemente dichas frecuencias ni las escuchemos, escuchando tan solo las frecuencias medias. Ahora imaginemos que de golpe subimos el volumen del reproductor musical. Lo que notaremos es que el mismo disco, en el mismo equipo, suena mucho mejor que antes. Eso es tan solo porque ahora somos capaces de escuchar claramente las frecuencias bajas y altas.
Ahora, si tenemos en cuenta que las curvas isofónicas se van aplanando a medida que subimos los niveles pensemos lo siguiente. Imaginemos que dos malos profesionales (ingeniero de mezcla e ingeniero de mastering) han coincidido en una producción y han dado como resultado un album extremadamente sobrecomprimido. Imaginemos que ponemos ese álbum a un nivel flojo en el equipo y que inmediatamente después ponemos ese disco favorito con el que hicimos el experimento antes sin mover el volumen del equipo. Nuestro disco favorito sonará mucho peor que el otro, ya que en este caso no estaremos escuchando las frecuencias bajas y agudas, aunque sepamos que ese último disco que hemos puesto suena infinitamente mejor que el otro. ¿Cuál es la solución a esto? Pues es bien fácil, cogemos el mando a distancia del equipo de reproducción y subimos el volumen… de esta forma disfrutaremos de las frecuencias bajas y altas en un disco con dinámica.
Hay que tener en cuenta que la gente “no freak” no pierde el tiempo en hacer comparaciones A/B de diferentes discos. Ellos llegan al coche, o al salón de su casa, o encienden el ipod y suben el volumen hasta que se sienten cómodos sin tener en cuenta si este disco suena de primeras con menos nivel que ese otro. La diferencia es que con un disco con dinámica ese oyente “no freak” disfrutará, y con un disco sobrecomprimido será raro que llegue a pasar del tercer corte.
La única situación donde no nos podremos librar de la sobrecompresión será cuando un tema musical tenga expectativas de ser difundido por radio o televisión. En este caso, debido a las características técnicas de esos medios de comunicación, es necesario sobrepasarse un poco en el tema de la compresión (tanto en mastering como en mezcla). Pero como todo en esta vida, menos la muerte, tiene fácil solución. La solución es tan simple como hacer mezclas y mastering especial de esos temas. Imaginaros que os llega una banda con un álbum de doce temas que quiere que mezcléis, y os dicen cuales van a ser los tres singles que tienen previsto lanzar. Muestro trabajo consistirá en mezclar esos doce temas más una versión especial de cada uno de esos tres temas previstos como singles. A esto se les llama “radio edits”. Estas mezclas suelen caracterizarse por tener un mayor grado de compresión y unos niveles de voces un poco más altos que en las mezclas “normales” que irán en el álbum. Al ingeniero de mastering le entregaremos los doce temas normales más los tres radio edits, indicándole que finalidad tienen esas tres mezclas especiales.
¿Cual es el problema de aumentar el volumen?
Aumentar el volumen en principio no es algo malo, siempre y cuando esa subida de volumen no afecte a la música. Existe una cosa que se denomina rango dinámico, y que es tan importante a nivel musical como de ingeniería de audio. Para no entrar en definiciones de rango dinámico que a la gente sin conocimientos técnicos no les servirá de nada, vamos a intentar explicar ese concepto por medio de ejemplos gráficos.
NOTA: Este artículo tiene la intención de ser entendible por la gente profana en materia de audio, así que en esta sección hablaré de pelos y gordos azules en vez de niveles de pico y RMS. Espero que los entendidos sepan disculparme.
Primeramente veamos la representación gráfica de un tema con un amplio rango dinámico:
Esta forma de onda pertenece al tema Fawkes the Phoenix, compuesta por John Williams para la banda sonora de Harry Potter y la Cámara de los Secretos.
En el tema de Williams vemos que cada parte del tema está muy bien diferenciada en la forma de onda. Se ve claramente cuando toda la sinfónica toca junta y lo hace con mucha intensidad y cuando solo hacen presencia algunos instrumentos. En definitiva, la forma de onda es una fiel representación del tema musical,
Algunos podréis estar penando… “claro, es que la música sinfónica tiene mucho rango dinámico ya de por si“. Os doy la razón, pero la dinámica no sólo hace referencia a los cambios de dinámica entre las diferentes partes de un tema. Yo siempre pienso en dinámica en dos términos:
- La diferencia de nivel entre las diferentes secciones del tema musical (que hemos visto claramente en el ejemplo de John Williams).
- Las variaciones de amplitud dentro de una sección del tema y que nos va a definir la forma en la que va a respirar la sección y el groove de la base rítmica.
Vamos a ver algunas representaciones gráficas de formas de onda de algunos temas musicales para aclarar este segundo punto. Es recomendable que pincheis encima de las imágenes para que podáis verlas a buen tamaño.
La forma de onda de arriba corresponde al tema Smells Like Teen Spirit de Nirvana perteneciente al disco Nevermind (1991). La del medio es del tema Make Love Like A Man de Def Leppard del album Adrenalize (1992). La de abajo corresponde al tema Warheads de Extreme incluido en el álbum III Sides to Eevery Story (1992).
Mirad primero la onda del medio, la del tema de Def Leppard. Podéis ver que tiene muchos “pelos”. Esto es indicativo de que la base rítmica del tema va a respirar. En este tema el juego bombo/caja va a estar muy marcado y va a dejar huecos dinámicos para distinguir bien los demás elementos del tema.
Si comparamos esta onda del medio con la de abajo, la del tema de Extreme, podemos ver que el “gordo azul” ocupa más espacio y que deja menos sitio para los “pelos”. Esto quiere decir que la sonoridad del tema de Extreme será superior al de Def Leppard, pero aun así seguimos viendo “pelos” y las base rítmica respira lo suficiente.
En la figura de la izquierda podéis ver la forma en la que terminan los “pelos” del tema de Def Leppard (arriba) y Extreme (abajo).
Vemos que en el tema de Extreme los “pelos” se cortan de forma abrupta al llegar al máximo nivel posible, cosa que en el tema de Def Leppard ocurre muy ocasionalmente. Esto se debe al uso de limitadores brickwall. Este tipo de limitadores se usaban originalmente para prevenir saturaciones puntuales en los conversores D/A, ya que tienen la características de adelantarse a lo que va a ocurrir mediante un sistema llamado look-ahead.
Sin entrar en profundidades técnicas sobre este tipo de limitadores, podemos resumir su funcionamiento como el de recortar la señal siempre que sobrepase un límite marcado sin que se produzca distorsión digital.
Si vemos la onda de arriba, la que corresponde con el tema Smells Like Teen Spirit, vemos que existen muy pocos “pelos” y que el “gordo azul” ocupa mucha porción de la onda. Quiero que os quedéis con esto, ya que me referiré a este hecho más adelante.
No ocurre nada por el uso de este tipo de limitadores siempre que nos mantengamos en unos rangos decentes, como ocurre en el tema de Extreme. Lo malo es que se ha tendido a abusar de este tipo de procesadores. Veamos un ejemplo:
En la siguiente gráfica podemos ver las formas de onda el mismo tema pero en diferentes versiones. Se trata del tema Cowboys from Hell de Pantera. La gráfica de arriba muestra la versión original de 1990 y la de abajo la versión remasterizada lanzada en el año 2010.
No creo que sea necesario que os diga que pasa en las gráficas de arriba que vosotros mismos no podáis intuir. Hablando en plata podemos decir que toda la dinámica del tema original se ha ido a tomar por culo. [Imagen perdida]A la derecha podéis ver la forma en la que se cortan la versión original y la versión remasterizada. Si escucháis las dos versiones veréis que la remasterizada suena muchísimo más fuerte, pero que parece más a un zumbido de una familia de abejorros que a un tema musical, y más cuando la base rítmica de la versión original es demoledora. La versión remasterizada es un buen ejemplo de lo que decía Bob Dylan soltó lo de: “Escucha esas grabaciones modernas, son atroces, tienen sonido por doquier. No hay definición de nada, no hay voces, nada, es igual que la estática”.
Podéis pensar que vale, que la versión remasterizada no tiene nada de “pelos”, pero que tampoco varía mucho de lo que pasaba con Smells Like Teen Spirit de Nirvana. Si pensáis eso estáis muy confundidos. En la canción de Nirvana, la ausencia de “pelos” y el alto porcentaje de “gordo azul” se debía al uso de compresores, y era un efecto buscado por el productor y el ingeniero de mezclas, y de hecho la base rítmica era muy poderosa. No me imagino ese disco sonando de otra manera. Suena sobrecomprimido pero sin distorsión. En el caso del remaster de Pantera esa ausencia de “pelos” se debe al uso indiscriminado de limitadores brickwall. Esto como resultado obtiene una onda llena de distorsión y un sonido totalmente aplastado.
¿De dónde viene eso de la guerra del volumen?
Si habéis entendido bien el apartado anterior no os costará mucho imaginar de donde viene toda esta guerra. Vamos a ponernos en situación. Vamos a imaginar que conducimos por una autopista escuchando una emisora donde, por ejemplo, sólo programan música de punk/rock americano. Vamos tranquilamente escuchando el tema Basket Case de los Green Day que fue lanzada en 1994. Al terminar, inmediatamente, pinchan un tema que no conocemos, pero que al estar editado en 2010 tiene una sonoridad mucho mayor. Esto nos hace pensar “madre mía, ¿quien es esta banda que suena más potente que los Green Day?”. Intentamos recordar algo de la letra para buscar luego por internet a quién pertenece el tema. Nos despistamos, aparece en medio de la carretera un mamut y… ¡crash!
Lo que quiero es que tengáis claro, como ya hemos dicho varias veces, que un tema musical con gran sonoridad que reproduzcamos justo después de uno con menos sonoridad siempre nos va a dar la impresión de que es un cañón, y los de las discográficas, que de tontos, al menos antes, no tenían ni un pelo, se dieron cuenta y empezaron a subir la sonoridad de los máster más y más para estar siempre por encima del competidor.
A fecha de la redacción de este artículo (agosto del 2011) la cosa ha llegado a unos extremos verdaderamente ridículos.
Death Magnetic y la gota que colmó el vaso
Hasta no hace mucho los profesionales que intentábamos hacer ver a nuestros clientes toda esta problemática sobre el volumen en las grabaciones éramos como profetas en el desierto. Todo el mundo nos decía “si, si claro que tenéis razón, pero quiero que este disco suene fuerte“. Todo eso cambió cuando en septiembre del 2008 apareción el album Death Magnetic de Metallica. Hasta ese momento la guerra del volumen nos traía locos a los profesionales. Ese disco inició el debate entre los consumidores. Se iniciaron miles de discusiones en foros alejados de la temática del audio y la producción e incluso aparecieron iniciativas para intentar que la discográfica lanzase una nueva versión del disco sin tanta distorsión.
Mucho se escribió en su momento sobre este disco, de los que mejor lo hicieron y más caña dio, y sigue dando, fue Ian Shepherd en su blog. Os recomiendo que os deis una vuelta por allí.
Quizá la cosa no llegó a tanto como la rebelión que sugería Jensen, pero lo que si ha supuesto es que muchos músicos se den cuenta de que sonar más fuerte no es sinónimo de sonar mejor. Y eso es lo que consiguió Metallica en pocos días, lo que llevábamos muchos intentando explicar desde hacía bastantes años.
Abajo podéis ver la forma de onda del tema The End of the Line contenido en Death Magnetic para que os hagáis una idea de lo que estamos hablando.
No creo que haga falta comentar nada sobre la imagen de arriba. Todo comentario sobra.
¿Quién es ahora el culpable?
Como ya hemos visto. El origen del problema vino por la necesidad de las discográficas de hacer que su producto fuera más llamativo que los demás cuando eran programados en los medios de comunicación. Pero eso solo fue el origen del problema. No es ningún secreto que en la actualidad la industria musical se encuentra en un profundo cambio, y que muchas bandas graban discos puenteando a las discográficas y sin ninguna aspiración de que sean programados ni en radio ni en televisión. Entonces…¿por qué seguimos con el problema del la guerra del volumen?
Desde mi punto de vista hay tres razones:
1- Por un lado los cambios en los hábitos de escucha y de acceso a la música ha provocado que poca gente siga escuchando discos enteros. Muchos son adictos a la evolución de aquellas cintas que grabábamos en las dobles pletinas y que etiquetábamos como “varios”. La gente o se programa listas de reproducción en sus aparatos o van saltando de disco a disco según lo que les apetece escuchar en cada momento, ya que ahora se tiene acceso a muchos discos sin necesidad de andar cambiando el soporte. Básicamente el problema radica en lo mismo que ocurría en la época de las discográficas y la radio. Nadie quiere que su tema suene aparentemente peor que el que se ha escuchado antes o el que se va a escuchar después. De hecho en el momento de escribir estoy terminando de producir un disco donde en eso radica una de las preocupaciones del cantante.
2- Es un hecho que los artistas intentan emular a sus grandes ídolos. Muchos de los discos que han aparecido en la última década tienen unos niveles de compresión que asustan, y muchos de esos discos se han convertido en referencias para muchos músicos jóvenes. ¿Quién no podría imaginarse dentro de unos años que alguien llegue al estudio y nos diga que quiere que su disco suene como el Death Magnetic? Si este artículo llega a remover la conciencia de alguno de estos jóvenes sería un gran logro para mi.
3- Muchos de los estudios donde se graban discos en la actualidad no son verdaderamente profesionales. Tanto su acústica, como su equipamiento y personal dejan bastante que desear. Unas de las maneras de que cierto disco suene mejor en apariencia que otro es haciendo que suene más alto, y a eso han jugado mucho este tipo de estudios. Yo he llegado a presenciar en uno de esos estudios como el señor que estaba a los mandos ponía un disco comercial de hace unos años e inmediatamente ponía la demo a una banda de amigos míos diciéndoles “claramente el vuestro suena con más pelotas”. En fin, lamentable.
Se ha echado mucha mierda encima de los ingenieros de mastering, y la gente ha sido muy injusta con ellos. De hecho, ellos son los primeros que están hasta las narices de tener que, una y otra vez, estropear el sonido por exigencias de otras personas. Muchos de los profesionales que estamos involucrados en un disco tenemos que tragar con lo que el cliente, ya sea discográfica o directamente los músicos, quieren. Yo he sido partícipe de algunas aberraciones sobrecomprimidas, y por desgracia que en los próximos años lo seré de algunas más. Todos tenemos nuestros principios y nuestras ideas, pero el que nos da de comer es el que manda.
Movimientos en contra de la guerra del volumen
En el momento en que los profesionales empezamos a ver que la subida indiscriminada de volumen en las grabaciones empezaba a suponer un problema más allá de cuestiones meramente técnicas, algunos tomaron algunas acciones y crearon organizaciones con el fin de intentar preservar la dinámica de las grabaciones.
Una de estas organizaciones es la llamada Turn Me Up! creada por Charles Dye, John Ralston y Allen Wagner. Esta organización da la posibilidad de certificar si tu disco cumple con los requisitos que ellos estipulan (aunque no se cuales son realmente) para considerarlo dinámicamente correcto. Tu les mandas el álbum, ellos lo analizan y te dan el certificado para que lo coloques en el artwork de tu álbum.
Otra organización que ha tomado bastante popularidad ha sido la Pleasurize Music Foundation. El gran acierto de esta organización ha sido establecer un sistema de medición y evaluación del rango dinámico ofreciendo sus propios medidores en formato plugin VST de forma gratuita, y estableciendo una serie de valores óptimos de rango dinámico para diferentes estilos musicales.
La luz al final del túnel
La tendencia en la reproducción de música es la del uso de archivos, ahora mismo en mp3 pero en poco tiempo será de archivos sin pérdidas. Los soportes físicos como el CD cada vez tiene menos uso y la distribución a través de internet se impondrá cada vez más. Esto tiene una consecuencia que puede acabar, o por lo menos paliar mucho, la problemática de la guerra del volumen.
Hay que tener en cuenta que en el momento que hablamos de archivos entra en juego un sistema operativo y sus respectivos programas. ¿Qué pasaría si los programas de reproducción implementasen alguna función para igualar la sonoridad de los temas? Automáticamente el propio reproductor subiría el volumen de los temas que tuvieran menos sonoridad y bajaría los de mayor volumen. De esta forma ya no necesitaríamos apretar las grabaciones en el mastering para que nuestro tema sonase igual de fuerte que los demás y que no diese la sensación de que suena peor.
Pues bien, eso ya existe, por ejemplo en Spotify (función igualar el volumen de todas las canciones en preferencias) y Itunes (la función Soundcheck). Aun queda mucho trabajo por hacer en esto, pero no será difícil que algún desarrollador implemente un algoritmo que sea capaz de terminar con la guerra del volumen. El problema que hay ahora mismo es que estos algoritmos meten a todo en el mismo saco, es decir, que una obra de música clásica la saca al mismo volumen que la pieza de punk más rabiosa.
No queda mucho tiempo en el que los algoritmos de igualación de sonoridad se implementen en todos los reproductores software y todos los dispositivos de reproducción como ipod, reproductor de coches, minicadenas,… Y cuando llegue ese momento…¿que haremos con toda la broza que se ha sacado en los últimos años? Pues muy fácil. Harán remasterizaciones pero esta vez bajando la sonoridad del máster y nos volverán a sacar los dineros.
Autor: José A. Medina (2011)