Creo que no hay tema más aburrido que el titubeo. Y en este sentido, muchas personas malinterpretan este concepto. Respondamos la pregunta más simple, ¿qué es el dithering?
Dither es solo ruido. Se trata de ruido añadido a la señal para que la cuantificación sea menos perceptible. Se debe aplicar tramado cada vez que se reduce la profundidad de bits. Si hay una reducción de 32 bits a 24 bits, la fuerza del dithering es casi irrelevante. Si se reduce el tamaño a 16 bits (o menos), probablemente lo mejor sea un tramado de bajo a medio con algo de forma de ruido.
El difuminado es una solución a uno de los problemas fundamentales del audio digital, por lo que si queremos comprender lo que hace, primero debemos comprender el problema. El problema es la resolución de amplitud o la precisión con la que podemos medir el nivel de la señal usando unos y ceros.
Los errores ocurren inevitablemente cuando intentamos medir una fuente analógica infinitamente variable (nuestro sonido) usando un número finito de valores digitales (esos unos y ceros). A veces, el nivel analógico será ligeramente más alto que el valor digital más cercano y, en otros casos, será más bajo. Es como intentar medir la altura de alguien con una cinta métrica que solo muestra sus piernas. En audio digital, este error de redondeo se conoce como distorsión de cuantificación. El uso de un sistema de punto flotante de 32 bits, como hacen casi todos los editores de audio modernos, hace que la distorsión sea tan baja que realmente no necesita preocuparse por ello (por cierto, al ordenar la mezcla y masterización en nuestro estudio, recibirá material en esta calidad de formato sin pérdidas). Sin embargo, a medida que disminuye la profundidad de bits, aumenta el nivel de esta distorsión. A medida que se acerca a los 16 tiempos, el sonido puede comenzar a ser bastante notorio y desagradable en las colas de reverberación, los retrasos y otras áreas silenciosas. Esto se debe a que el número de bits determina cuántos valores discretos puede almacenar.
— Ver también: ¿Qué es bit leasing? (poco alquiler) —
Echemos un vistazo rápido a cómo se ve este error de cuantificación. Primero, aquí hay una onda sinusoidal de 1 kHz, -96 dBFS representada por un punto flotante de 32 bits.
Aquí está la misma sinusoide, pero reducida a 20 bits, sin dithering (en 24 bits, la diferencia es difícil de evaluar visualmente).
Y a modo de comparación, la sinusoide se reduce a 16 bits, también sin dithering
¿Qué pasa con el sonido?
Los picos más altos fueron difíciles de redondear, por lo que se dejaron alargados mientras que el resto se redondeó a cero. Dependiendo de dónde cayó el pico de la onda sinusoidal en relación con el tiempo de muestreo, se redondearon una o dos muestras.
Entonces, ¿qué hace el difuminado de audio y cómo puede ayudar?
En esencia, el tramado es solo ruido, y el ruido, por su propia naturaleza, es aleatorio. En los primeros días del audio digital, algunos ingenieros inteligentes se dieron cuenta de que podían aprovechar el ruido aleatorio. Al mezclarlo con la señal cuantificada, podrían agregar suficiente variación para preservar la señal original.
El punto clave aquí es que el ruido de tramado no debería estar completamente relacionado con la señal cuantificada, a veces denominada «descorrelacionada». Cuando se cumple esta condición y el nivel de ruido de interpolación es correcto, cualquier muestra de entrada determinada se puede redondear hacia arriba o hacia abajo según el valor de la señal de entrada. Esto no solo ayuda a preservar la señal, sino que virtualmente elimina la distorsión asociada con su contenido de frecuencia.
— Ver también: Software de calibración de auriculares (ecualización de respuesta de frecuencia) —
Veamos un par de ejemplos más ilustrativos. Primero, aquí hay una onda sinusoidal de 1 kHz que decae desde aproximadamente -116 dBFS.
Ahora reduzcamos a 16 bits (sin dithering).
Como esperábamos, la señal cae a cero cuando pasa -96 dBFS, y podemos ver distorsión. ¿Qué pasa si agregamos dither antes de reducir la escala a 16 bits?
Hay tres cosas muy notables para notar aquí:
- La señal original ya no cae abruptamente a -96 dBFS, sino que se convierte en ruido.
- Esto da como resultado un aumento en la relación señal / ruido de aproximadamente 16 dB.
- Las distorsiones anteriores han desaparecido. No se disfrazan ni se esconden bajo el ruido, sino que en realidad se eliminan.
El punto clave para enfatizar es que ha reemplazado la distorsión tonal con ruido, que a su vez es su propia forma de distorsión. Sin embargo, es preferible un ruido silencioso uniformemente distribuido a la distorsión armónica debido a la variación aleatoria.
A veces escucha que no necesita dithering si está utilizando un complemento vst en particular, porque (el ruido) se cura solo. Esto puede ser técnicamente cierto, pero solo en algunos casos específicos. Lo crea o no, no todos los ruidos son iguales. Por lo tanto, si el programa no tiene un ajuste de tramado específico, debe agregarlo si planea reducir la profundidad de bits. Las diferentes estaciones de trabajo de sonido funcionan de diferentes maneras, pero la mayoría ofrece algún método para capturar una cadena compleja de efectos de sonido en un archivo. Si no ha explorado las posibilidades de hacer esto en su software DAW, podría ser el momento de configurarlo. Es mejor usar números de coma flotante de 32 o 64 bits siempre que sea posible, pero si se ve obligado a usar números de 24 bits, verifique si hay una opción para habilitar el difuminado. Esperamos que esto le ayude a comprender por qué el dithering es tan importante para el audio digital, cómo y por qué funciona y cuándo debe aplicarse.