UN VISTAZO AL MASTERIZACIÓN
Por Paul J. Stamler
La masterización de audio profesional es un tema tan enorme que realmente necesita todo un libro para hacerle justicia, y ese libro ya existe. De hecho, al menos dos me han llamado la atención: “Mastering Audio: The Art and Science” de Bob Katz (ahora en su tercera edición) y “Mastering Audio: Essential Practices” de Jonathan Wyner. Estos dos autores cubren el tema magistralmente.
No voy a abordar la cuestión de si debes masterizar tu álbum profesionalmente o hacer el trabajo tú mismo. Ese es un gran tema que merece otro largo artículo.
En su lugar, me limitaré a discutir tres subtemas en el campo más amplio de la masterización: planificar el orden de las canciones en un álbum; recortar el comienzo y el final de cada pista, y el tema eterno: los niveles de audio.
Contexo de la masterización de audio profesional
Asumiré que estás masterizando para un lanzamiento de CD. a veces leo artículo de magnates de la industria de la música que predicen la desaparición del CD como formato, pero creo que es ellos se sorprenderán. Los CD como medio para la entrega de música son demasiado convenientes y rentables para llegar a desaparecer; ofrecen una calidad decente (incluido el potencial de un buen rango dinámico y robustez contra el daño físico), son fáciles de vender después de un concierto y ofrecen a los artistas la oportunidad de presentar canciones en una secuencia planificada.
El orden de las cosas
Hace unos 30 años, leí una reseña que hablaba sobre el puro placer de sentarse con un nuevo álbum y rendirse a la idea del artista: el álbum como un viaje bien planificado, con un principio, medio y final. Un recorrido de la mente del artista, con canciones en puntos de interés clave.
Hablemos sobre el proceso de creación de esa secuencia de canciones: la lista de canciones, por así decirlo, para la interpretación que ofrece al oyente. Para ilustrar, voy a hablar sobre un proyecto de álbum en el que trabajé recientemente: la reedición del clásico de 1980 del cantante de cowboy Bob Bovee, “The Roundup”. Originalmente, por supuesto, este era un LP, y en esa encarnación era uno de mis favoritos. No hice la grabación, ni creé la secuencia, pero creo que ambos son excelentes, y me sentí honrado cuando Bob me pidió que la remasterizara para un CD.
Para quién es la música
Averiguar el orden en el que se presentan las canciones depende de la audiencia a la que está destinado el producto, y para la mayoría de los artistas de producción propia hay dos audiencias principales que deben considerarse por separado. Primero está el fan, que compra el álbum después de un concierto, lo ordena en Internet o lo compra en una tienda de discos.
(¿Recuerdas las tiendas de discos?) El segundo es la persona de la industria musical, que recibirá el álbum como parte de los esfuerzos promocionales del artista; esa audiencia incluye a los DJ de radio y directores de música, así como a los propietarios de los locales a quienes el artista envía el CD con la esperanza de obtener un concierto.
Cómo se ecucha el álbum
Estas personas escuchan el álbum de manera diferente. El fan probablemente escuchará todo el tiempo. La secuencia les importa. La persona de industria, por otro lado, probablemente escuchará cortes individuales, tendrá una idea del atractivo del artista a partir de canciones individuales y decidirá si programar el álbum en la radio o contratar al artista.
Aquí hay algo que necesitas saber sobre la transmisión de radio: aparte de las estaciones de radio de la universidad y de la comunidad, la mayoría de los DJs no pueden elegir la música que reproducen; esa decisión la toma el Director de Música de la estación (o grupo de estaciones). A menudo, el responsable de la toma de decisiones (Director de música o, rara vez, DJ) recibe docenas o cientos de CD para su consideración cada semana, y no tiene la oportunidad de escuchar en profundidad. De hecho, muy a menudo tomarán su decisión basándose en una rápida escucha de la primera canción del álbum.
La primera canción
Por lo tanto, te toca a ti, el artista, hacer que la primera canción sea lo más atractiva posible. Incluso podrías poner la mejor pista en el álbum de primero. Ahora, eso va en contra de la idea de que un álbum debería tener una trama general: la mejor pista del álbum podría ser un punto máximo emocional. Pero si estás trabajando para atraer a los de la industria, que deciden el juego y los posibles conciertos, esa primera pista tiene que agarrarlos por el pelo y hacer que escuchen.
Si aún quieres apelar al fan, que escucha todo el tiempo, es posible que no pongas primero la mejor canción, sino que la guardes para más adelante. Pero ciertamente quieres que la primera canción sea accesible. Este no es el lugar para esa extraña pero divertida danza húngara en modo Lidio. En su lugar, quieres algo up-tempo y atractivo. Algo que atrape a la persona de la industria y al fan por igual.
Después de la primera canción
Después de esa primera pista, es importante mantener una sensación de movimiento hacia adelante mezclando lo rápido y lento, lo divertido y serio, lo ligero e intenso, largo y corto. Aquí está la secuencia del álbum de Bob Bovee, con anotaciones.
Puedes ver cómo Bob comenzó con una canción accesible de Hank Williams, luego alternó el tempo ascendente con el tempo medio o lento; serio con gracioso. Él también mezcló las tonalidades; es probable que una secuencia de cuatro canciones en G (digamos) golpee a los oyentes de todo el camino como canciones aburridas, aunque tal vez no puedan decir el por qué. Mirar la tabla revela un uso pronunciado de la tonalidad D, pero solo hay un punto en el álbum que coloca dos melodías de D en secuencia, y una de ellas es instrumental.
¿Cómo crear secuencias que tengan sentido?
He encontrado un método refrescante de baja tecnología. Hago trozos de papel con el título de la canción, el tempo y el tipo de anotación que he hecho en la tabla (lento, rápido, intenso, etc.). Incluyo la tonalidad. Coloco las notas sobre una mesa, comenzando con la primera y la última melodía del álbum; saber cómo comienza y termina el viaje proporciona un buen soporte para lo que sucede. Luego revolveré los trozos alrededor de la mesa hasta que lo que veo tenga un sentido emocional. Cuando tenga una secuencia que funcione, la escribiré y armaré un CD de prueba para saber si lo que funcionó en la mesa funciona para mis oídos. Por lo general, funciona.
Cortando en la masterización de audio profesional
Cuando se prepara una pista individual para incluirla en un CD, es importante prestar atención a cómo comienza. Parece obvio comenzar desde el principio, con el ataque de la primera nota, pero eso no funciona.
El problema es el siguiente: los reproductores de CD silencian su audio, excepto cuando los datos digitales están fluyendo, y no siempre se silencian inmediatamente cuando se presiona el botón Play. Esto no es un problema para el fan que escucha el disco todo el tiempo, pero puede estorbar a cualquier persona que intente tocar canciones individuales, incluidos los DJ de radio, directores de música y oyentes domésticos que escuchan en modo aleatorio.
Oyentes de industria
Para estos oyentes de industria, la primera nota o palabra de una pista puede cortarse mientras el reproductor está ocupado desactivando el silencio. Ten en cuenta que el problema se manifiesta agudamente para los disc jockeys de radio: si vas a tener exposición a la radio, necesitas un producto físico que no arroje barreras para la transmisión de la canción.
Después de experimentar con una variedad de reproductores de CD, incluidos reproductores de consumo para uso doméstico, equipos de sonido para autos y unidades profesionales (como las que se encuentran en las estaciones de radio), he llegado a la conclusión de que es necesario que haya una almohadilla mínima de 1/3 seg. antes de que suene el audio de la canción, que se traduce en 333 milisegundos (ms). Menos que eso es arriesgado.
333
Puede intentar buscar el comienzo real de la música, y luego usar la aplicación DAW para insertar 333 ms de silencio, comenzando la pista al comienzo del silencio. Eso es posible, pero no siempre es una buena idea.
En la mayoría de las grabaciones, el “silencio” antes de que comience la música no es realmente silencioso: contiene el tono de la sala, en su mayoría sonidos débiles del sistema de manejo de aire del edificio. (Esta es la base de la famosa pieza “4:33” de John Cage, que presenta a un pianista sentado en una sala de conciertos en silencio; al final, sus oídos se ajustan y se da cuenta de que el “silencio” no es realmente silencioso. )
Si simplemente insertas 333 ms de silencio digital en la cabecera de una pista, es posible que el nivel de la señal producida por el tono de la sala en el punto de transición sea algo distinto a cero, lo que puede generar un clic suave mientras el reproductor hace el clic saltar.
Qué hacer
Hago un recorrido final alrededor de esto, y muchos otros grabadores también lo hacen. Primero, mido 333 ms antes de First Audio, y borro todo lo que viene antes. Ahora la pista comienza con 333 ms de tono de habitación, mi pad.
A continuación, resalto los primeros 220 ms de este pad y uso la aplicación DAW para silenciarlo. Resalto el área directamente a la derecha de la sección silenciada y hago un fundido de entrada con la DAW. La Figura 1 muestra el resultado: he subido un poco el nivel para que el tono de la habitación sea visible. De izquierda a derecha, puede ver la sección silenciada, la aparición gradual (resaltada), un poco de tono de la habitación y el primer audio real.
Un par de consejos: Me he dado cuenta de que una duración de desvanecimiento de 78 ms me proporciona una transición suave y agradable del silencio (real) al tono de la habitación. Esto funciona cuando el tono de la habitación es pseudo-silencio; a veces, sin embargo, el tono de la sala debe ser audible, como en una grabación de concierto cuando debemos escuchar el ruido del público. Para esos casos, he encontrado que, después de los 220 ms de silencio silenciado, un tiempo de atenuación de 33 ms es mejor; esto permite que el tono de la sala se “establezca” en la mente del oyente antes de que comience la música real.
Secuencia
Si la secuencia “superior” que acabo de describir está diseñada para el controlador de acceso que escucha las pistas individuales (o las reproduce en la radio), la siguiente secuencia es para el fan que escucha el CD hasta el final.
Lo que viene al final de una pista determina qué tan pronto comienza la siguiente pista, lo que afecta el ritmo emocional del álbum.
En los días de LP, muchos ingenieros tenían un estándar personal para determinar cuánto papel en blanco iría entre las pistas. Las cifras típicas fueron entre 3 y 4 segundos. Tengo algunos LPs que usaron 5 ó 6 segundos. (Demasiado tiempo, en mi opinión; los álbumes se hacían largos como resultado). Y en la década de 1960 hubo una moda iniciada por el álbum clásico de Sgt. Pepper de los Beatles donde cada canción fluía directamente hacia la siguiente sin pausa.
Término medio
Yo, por lo general quiero algo en el medio. El ingeniero que reunió el LP de Bob Bovee usó 3 segundos entre cortes, y eso es lo que generalmente hago también. Así es cómo:
Primero, encuentro Last Audio, el punto donde la nota musical final cae por debajo del tono de la sala. A partir de ese momento, resalto aproximadamente 1 segundo del tono de la habitación y hago un fundido de salida. En el punto donde el desvanecimiento llega a cero, insertaré 2.667 segundos de silencio, finalizando la pista al final del silencio; con los 333 ms de pad al comienzo de la siguiente pista, eso sumas 3 segundos. La figura 2 muestra un ejemplo. Puede ver, de izquierda a derecha, las notas de cierre, el marcador DAW que marca el último audio, el desvanecimiento y el silencio insertado, que está resaltado.
En el nivel
La tercera área de masterización de audio profesional que quiero tocar son los niveles. Uno de los objetivos de masterizar un álbum para el fan, es tener un grado de uniformidad entre las pistas. Eso no significa que todo deba sonar igual, pero sí significa que una pista en particular no debe sobresalir de manera negativa, ya sea porque es demasiado fuerte o demasiado suave.
En estos días, muchas personas nuevas en el audio normalizarán cada pista; la función “normalizar” está incorporada en la mayoría de las DAW y es fácil de aplicar. Pero esta estrategia no funciona, por lo general. La intensidad percibida de las pistas normalizadas variará en todo el mapa. ¿Cómo?
El problema de normalizar
El problema es que hay más de una forma de medir el nivel de una señal de audio. El método que se ha hecho omnipresente en la práctica moderna del audio es medir (utilizando un gráfico de barras en la pantalla de la computadora o una fila de LED en la interfaz) el nivel máximo de la señal, el valor de la forma de onda a medida que aumenta al máximo. Esta medición se calibra en dBFS, lo que significa decibeles con referencia al valor digital máximo posible en el sistema (un número binario que es: 1111111111111111 en un CD de 16 bits).
Como dije, esta medida de nivel de lectura máxima es ubicua en el audio de hoy, y eso tiene sentido. En la grabación digital, es importante evitar las sobrecargas, incluso las cortas, porque suenan terribles. La medición de picos le muestra el nivel instantáneo de la forma de onda, lo que le permite evitar sobrecargar a los convertidores con una señal que está demasiado caliente.
El nivel medio
La otra forma de medir una señal es el nivel medio. En los días análogos, esto se midió utilizando medidores de VU mecánicos (VU significa “unidad de volumen”) que se diseñaron deliberadamente con una respuesta lenta que ignoró los picos de muy corto plazo. Esto también tenía sentido, porque en estos sistemas analógicos (especialmente en la cinta magnética), las sobrecargas momentáneas no eran audibles, por lo que si un medidor VU no las detectaba, no se producía ningún daño real. Pero aquí está el punto crucial: ¡la respuesta del medidor VU se correlaciona mucho más estrechamente con el nivel que escucha que la respuesta del medidor de lectura pico!
Eche un vistazo a las Figuras 3 y 4. Estas son capturas de pantalla de las formas de onda DAW de dos pistas de un proyecto remasterizado de grabaciones de Gospel que hice hace un par de años. Los niveles máximos son muy diferentes: la Figura 3 alcanza un máximo de aproximadamente –13 dBFS, mientras que la forma de onda de la Figura 4 alcanza picos de aproximadamente –3 dBFS.
Diferentes caminos
Ambos, sin embargo, se masterizaron al mismo nivel en un medidor de promedios, y suenan como si tuvieran el mismo volumen. Claramente, la Figura 3, con una baja relación pico/promedio, se registró originalmente con cierta compresión/limitación seria, mientras que la Figura 4 se registró sin, y mantiene una relación robusta de pico a promedio.
El proceso de normalización en la mayoría de los DAW funciona en los niveles máximos, por lo que si normalizo estas dos grabaciones a valores máximos idénticos, sus diferentes proporciones de pico a promedio me dejarán resultados muy diferentes. De hecho, la grabación de la Figura 3 terminaría midiendo unos 10 dB más alto en una V.U. medidor, y sonaría aproximadamente 10 dB más caliente que el oído de un oyente. Esa es una gran diferencia.
Medidores VU
Las especificaciones para los medidores de VU verdaderos datan de la década de 1930 y son muy claras acerca de la forma en que debe moverse la aguja: la rapidez con que debe subir y bajar y el tipo de señal que la lleva al nivel de 0 vu. Estas especificaciones se denominan balística del medidor. Los medidores de VU mecánicos reales son ahora extremadamente caros.
Encontré una unidad de dos canales en línea que se vendió por US$ 575. Tengo uno modificado (ver Figura 5) para que el nivel de señal 0 vu ajustable. (Sí, la “vu” minúscula se considera adecuada para describir un nivel, a pesar de que se llaman “medidores VU”).
Pero, ¿qué sucede si no puedes encontrar medidores de VU reales en venta o no tienes ganas de gastar el dinero?
Alternativas
Afortunadamente, hay alternativas de software. Hay varios plug-ins disponibles en Internet que pretenden imitar la balística de un medidor VU real. Hice algunas búsquedas en Google, y descubrí que (a partir del testimonio del usuario), varias de ellas tienen problemas para integrarse con DAW del mundo real, o están asociadas a sitios que pueden estar infectados con malware.
Un programa que funciona y parece seguro, está disponible como descarga gratuita desde Orban (fabricante de procesadores de dinámica de hardware para radio). Viene en versiones para ediciones modernas de sistemas operativos Windows o Mac, y está en www.orban.com/meter. Incluso hay una versión especial para los usuarios de Win-XP como yo.
También hay un software de Propellerhead a un precio modesto que parece útil (aunque no lo he probado). Eso es en tinyurl.com/propheadvu. Y cada vez más compañías están incluyendo medidores realmente confiables como parte de su software, o como paquetes de medidores por sí mismos (por ejemplo, Metric Halo SpectraFoo e iZotope Insight).
Flujos de trabajo
Masterizar el álbum de Bob Bovee que mencioné anteriormente no fue fácil. No tuve que determinar el orden, porque Bob quería mantener la secuencia del LP original. Sin embargo, tuve que hacer ajustes a cada pista, y para algunos de ellas, Bob quería que desapareciera el “sonido” de los instrumentos al final de cada pista un poco antes; el ingeniero original había dejado todo esto, y Bob sintió que eran un poco largos y que desaceleraban el ritmo del álbum. Estuve de acuerdo. Hice los cambios en el DAW marcando donde pensé que deberían terminar luego resalté unos segundos e hice los fade-out; al final de ellos puse el estándar de 2.666 seg. de audio en blanco.
Luego llegó el momento de jugar con los niveles. He mencionado que un medidor de VU se correlaciona bastante con lo que escucha un oyente. “Bastante cerca”, sin embargo, no es lo suficientemente bueno para masterizar. Lo que hice fue establecer los niveles de cada pista la primera vez utilizando los medidores VU; después de eso usé mis oídos. Elegí las secciones vocales de la primera pista, “California Zephyr”, como mi “pista de índice” (ver Figura 6). Abrí la pista de índice en una instancia de Audition, luego abrí las otras pistas una por una en una segunda instancia, e hice comparaciones A/B entre ellas. Cuando hice eso, descubrí que los niveles necesitaban ajustes leves (nunca más de 1 dB) para coincidir con la sonoridad de la pista de índice. Hice esos ajustes, retiré algunos sonidos ruidosos en una pista que sobrepasó sus límites, convertí las pistas en archivos de 16 bits (habían estado en punto flotante de 32 bits hasta entonces), grabé un CD y lo envié. A Bob le gustó y lo envió a la planta para que lo presionaran.
¿Qué pasa con la compresión? Descubrí que no necesitaba agregarla; el ingeniero que hizo la grabación original ya había comprimido la señal tanto como fue necesario.
La guerra de ruido (loudness wars)
Quiero mencionar una tendencia nociva que se ha extendido por el mundo de la masterización de audio profesional en la última década: la práctica de elevar el nivel promedio súper alto mientras aplasta todos los picos hasta un solo nivel. Esto se deriva de la creencia de que si tu CD es más alto que el de todos los demás, atraerá la atención de la industria.
Hay varios nombres para este tipo de audio e. He oído que se llama “audio de pasta de dientes” porque la forma de onda en una DAW parece una pasta de dientes exprimida de un tubo; nuestro Editor prefiere “bricked”, tanto porque los limitadores de brickwall se usan para crearlo como porque a sus ojos, la forma de onda es tan plana y sin rasgos como un ladrillo. Ver la Figura 7 y contrasta esto con la Figura 6, una pista con buena dinámica. Me acerqué a un pico de otra grabación cerrada (Figura 8), y puede ver que el nivel máximo es de 0 dBFS (y trata de subir).
Esto suena mal en el CD, pero si el archivo se convierte a un MP3 para su venta como descarga, suena realmente mal.