Pregunta:
¿Qué impacto tiene la aplicación de ganancia a una señal de audio digital en la reproducción?
Raheel Khan
2014-03-18 22:03:27 UTC
view on stackexchange narkive permalink

Me gustaría saber qué papel tiene el control de ganancia (volumen) digital en la calidad lógica y percibida. Tengo conocimiento sobre cómo se almacena el audio digitalmente, pero no sé cómo funciona el volumen más allá del hecho de que se relaciona con la magnitud o amplitud de la señal digital.

Algunos sistemas de edición y reproductores pueden aplicar una ganancia que aumenta el nivel de la señal más allá del 100%, asumiendo una fuente digital sin pérdidas y niveles de amplificador analógico razonables, ¿el aumento artificial de las señales digitales más allá del 100% tiene algún efecto sobre la calidad? Esto supone, por supuesto, que el 100% no requiere manipulación de la señal en absoluto (puede que me equivoque aquí).

Tenga en cuenta que la pregunta es solo sobre volumen digital y no analógico.

hola raheel, desafortunadamente este es un foro de diseño de sonido y no un foro de VLC. Sin embargo, si está interesado en el audio digital en general, puedo recomendar este artículo: http://en.wikipedia.org/wiki/Clipping_(audio). Y para leer más en profundidad, consulte esto: http://www.soundonsound.com/sos/sep13/articles/level-headed.htm
@ArnoudTraa: Gracias por los artículos. Sin embargo, mi pregunta no es sobre VLC. Tiene más que ver con el papel que juega el volumen en la cadena de conversión de una señal digital en una audible. Si tiene alguna sugerencia sobre cómo mejorar la pregunta, será bienvenida.
Bueno, para ser honesto, si ha leído el artículo sobre recorte digital, debe saber la respuesta. si supera el 100% en VLC o en cualquier otra aplicación de audio, el audio se cortará en un punto determinado, según el volumen de la fuente. esto es cierto independientemente de la conversión analógica.
Dos respuestas:
AJ Henderson
2014-03-18 23:46:33 UTC
view on stackexchange narkive permalink

Primero, comencemos por aclarar que "volumen" no es un concepto particularmente técnico. Generalmente, "volumen" se refiere a SPL o nivel de presión sonora, que es la cantidad de presión que ejercen las ondas sonoras y depende de la distancia desde una fuente de sonido.

Más bien de lo que estamos hablando aquí es del impacto del nivel de la señal. Dentro de un sistema analógico, el nivel de la señal está determinado por la amplitud del voltaje. Si la señal se vuelve demasiado fuerte, los circuitos analógicos no pueden manejarla y se produce una distorsión.

Por otro lado, para las señales digitales, no estamos tratando con voltajes (bueno, no directamente) sino más bien 1 y 0 que describen muestras de audio. Simplificado un poco, cada muestra describe el voltaje de la señal analógica en el momento en que se tomó la muestra. A la amplitud máxima que puede soportar el sistema se le asigna el número máximo ya la amplitud mínima se le asigna el número mínimo.

Este rango es lo que se conoce como el rango dinámico de la señal digital. Los valores directamente en el medio son 0, los valores que se acercan a 0 son tan negativos como el rango puede cubrir y los valores cercanos al máximo son tan positivos como puede describir el archivo digital.

Entonces, ¿qué es "aumentar el volumen"? Bueno, realmente esto está aumentando la ganancia. La ganancia es la cantidad de amplificación realizada a la señal. Con una señal analógica, implica aumentar la amplitud de la señal y en digital significa mover los valores más lejos del punto medio.

Si, por ejemplo, tuviera un archivo de audio que pudiera usar valores de -10 a 10, 0 sería el punto medio. Si duplico el nivel de la señal, los valores de 0 permanecerían iguales, los valores de 3 se convertirían en 6, -3 se convertirían en -6, etc. Pero, ¿qué sucede cuando alcanzamos un número como 7? Bueno, 7 duplicado sería 14, pero solo tenemos la capacidad de representar hasta 10.

A menos que también aumentemos la profundidad de bits del archivo de audio, no tenemos forma de expandir la preservación de la señal y solo podemos almacenar un valor de 10. Esto es lo que se conoce como recorte (porque el valor llegó a alto y tuvimos que recortar el valor al máximo (o mínimo) que pudiéramos representar.

El recorte da como resultado la producción de ondas cuadradas que no suenan naturales y han perdido información. Por lo general, produce sonidos de crujidos y estallidos porque un hablante no puede producir una onda cuadrada de manera efectiva.

Sin embargo, vale la pena señalar que esto solo ocurre si realmente va más allá de lo que el archivo puede admitir. Si, por ejemplo, el archivo original solo fue a -5 y 5, no habría recorte ni pérdida de datos de eso.

Dicho esto, hay otro problema del que no hemos hablado todavía. Piso de ruido. En cualquier sistema, hay una cierta cantidad de ruido. El ruido son datos basura que se recogen y no tienen ningún significado. Es simplemente aleatorio y no forma parte de la señal. buen audio, desea una alta relación señal / ruido (la señal es alta, el ruido es bajo).

Sin embargo, la mayoría de los sistemas tienen un piso de ruido por debajo del cual la señal no se puede distinguir del ruido. Entonces, digamos que el sistema que grabó nuestro archivo en nuestro ejemplo anterior tenía un piso de ruido de 1. Esto significa que cualquier señal más silenciosa que -1 a 1 no se distinguiría del ruido de fondo. Cuando aplicamos nuestra ganancia, también aumentamos el nivel de señal de este ruido, por lo que ahora cualquier cosa más silenciosa que -2 a 2 es ruido y el ruido será tan amplificado como el sonido que queremos.

Sin embargo, también ofrece algunos beneficios en el futuro. Digamos, por ejemplo, que DAC (convertidor digital a analógico) tiene un piso de ruido de 3. Si no aplicamos ninguna ganancia, perderíamos mucha calidad de señal en el DAC porque solo tendríamos la diferencia entre 3 y 5 para una señal significativa, ya que nuestra señal solo subía hasta 5 como máximo. Sin embargo, si aplicamos una ganancia de antemano, nuestro piso de ruido en el DAC aún sería 3, pero nuestra señal máxima sería 10, dándonos una señal analógica mucho más limpia al final.

Entonces, la respuesta corta Su pregunta es, aumentar digitalmente el nivel de la señal resultará en recorte y producción de onda cuadrada si hace que se exceda el rango dinámico del archivo y también resultará en un aumento del piso de ruido de la señal . Dicho esto, también ayuda a evitar el ruido de fondo de cualquier dispositivo en sentido descendente desde la ganancia . En general, la regla es que desea la señal digital más fuerte que pueda tener sin recorte en ningún punto, lo que le brinda el mayor espacio entre el piso de ruido y la señal .

georgi
2014-03-19 02:25:28 UTC
view on stackexchange narkive permalink

En lo que respecta a los dígitos, puede multiplicar por cualquier "ganancia" que desee, siempre que no se desborde (-127 a 128 para 8 bits; -32676 a +32678 para audio de 16 bits; ± 8,3x10 6 para audio de 24 bits y hasta ± 1,7 × 10 38 para punto flotante de 32 bits). Sin embargo, habrá algo de redondeo involucrado, y cuanto menos bits, mayor será el error de redondeo.

Tenga en cuenta que sea cual sea el formato, en PCM lineal, un pico a -6dB todavía tomará la mitad del valor máximo en términos de números.

Sin embargo, para sistemas (típicamente de 16 bits) que utilizan difuminado para aumentar el rango dinámico y reducir la distorsión, la aplicación de ganancia después de que se ha producido el difuminado aumenta el ruido deliberado inyectado en el piso para compensar la cuantificación errores y pueden introducir nuevos errores de cuantificación.

Una vez que el piso de ruido es más audible, también con más errores de cuantificación (puesta en escena de ganancia sin resolución suficiente, lo que lleva a demasiados errores de redondeo), la claridad de la señal comienza a disminuir. Esto es, por supuesto, asumiendo que aún no se ha producido ningún recorte u otra distorsión. Por lo tanto, los DAW y los complementos funcionan internamente en PCM de 32, 40, 48 o 64 bits.

Hasta ahora, esto es puramente digital. Cuando la señal pasa por los convertidores, entra en todo tipo de no linealidad, desde los DAC (ninguno es perfecto y la sabiduría generalmente aceptada es que caliente es mejor siempre y cuando no recorte), a través de la cadena de señal (algunos unidades son deliberadamente no lineales), a los amplificadores y altavoces (clases de amplificador, pero también rigidez del cono del altavoz) y, finalmente, a sus oídos (fletcher munson).

En general, si un sistema tiene suficiente resolución , a partir de 24 bits, no me preocuparía por la ganancia, y solo me preocuparía por el headroom (digital no pasará de 0dB), o el ruido de la señal de la fuente (se amplifica tanto como la señal). A veces, tu cerebro hace el trabajo de reducción de ruido por ti, pero el umbral de cada persona es diferente. Hace que el tema sea realmente emocionante para mí.

En teoría, para obtener los mejores resultados, juegue con ganancia 0 en todas partes. Software de origen -> volumen del sistema -> mezclador de interfaz de audio. En la práctica, en una canalización de más de 24 bits, puede ocuparse de sus necesidades y no prestar atención a los dígitos.



Esta pregunta y respuesta fue traducida automáticamente del idioma inglés.El contenido original está disponible en stackexchange, a quien agradecemos la licencia cc by-sa 3.0 bajo la que se distribuye.
Loading...