Sección II

Factores que Afectan la Inteligibilidad en los Sistemas de Sonido

El objetivo de un sistema de refuerzo de sonido destinado a reproducir la voz humana es entregar ésta a los oyentes con suficiente claridad para ser comprendida. Dada la complejidad de la señal de la voz humana, la tarea de proveer una alta calidad al amplificarla en el mundo real y especialmente en condiciones menos que ideales, es doblemente complicada.

Aquí observamos el diagrama de un sistema de refuerzo de sonido. El mismo nos muestra los principales factores que afectan la inteligibilidad. Nos indica, además, un número de factores acústicos, electromecánicos y electrónicos que debemos considerar para mantenerla. Para poder ocuparse de todos estos factores eficazmente, debemos comprender cómo cada uno de ellos afecta la señal del habla.

Enmascaramiento

El obstáculo más común que los diseñadores de sistemas de refuerzo de sonido enfrentan es la intrusión de sonidos indeseados que inevitablemente interfieren con la señal del habla. Este efecto es llamado "enmascaramiento", -un término general que comprende una gran variedad de situaciones.

Aquellos ruidos que enmascaran provienen de fuentes acústicas como equipamiento de ventilación, tráfico, muchedumbres y comúnmente, reverberaciones y ecos. Las fuentes electrónicas pueden ser el ruido térmico, el siseo de cintas magnéticas, o distorsiones. Si el sistema de sonido tiene picos muy grandes en su respuesta de frecuencia, la misma señal hablada puede incluso enmascararse a sí misma.

La proporción entre la potencia de la señal del habla y el sonido que la enmascara es llamada "relación señal a ruido" y se expresa en decibeles. Idealmente, esta relación señal a ruido es mayor a 0 dB, indicando que la señal del habla es más potente que el ruido. Cuánto más potente necesita ser la señal del habla para que pueda ser comprendida depende, entre otros factores, del tipo y del contenido espectral del ruido que la enmascara.

El ruido llamado "de banda ancha" es el que más uniformemente enmascara una señal. Aquí podemos observar un gráfico que nos muestra la articulación de palabras contra la relación señal a ruido cuando la fuente enmascarante abarca frecuencias desde 20 Hz hasta 4 Khz. Nótese que la señal debe ser 12 dB más potente que el ruido de banda ancha para lograr un 80% de reconocimiento de las palabras.

Aunque el ruido de banda estrecha enmascara menos eficazmente el habla que el de banda ancha, el grado de enmascaramiento varía con la frecuencia. Aquí podemos ver una gráfica de la "Articulación de palabras" contra la Relación señal a ruido en dos bandas- 135 a 400 Hz ( el rango fundamental de la voz humana) y 1800 a 2500 Hz ( el rango en el cual las consonantes son más potentes).

Las altas frecuencias enmascaran sólo las consonantes, y su eficacia como máscara decrece a medida que el ruido se hace más potente. En cambio, los ruidos de bajas frecuencias son más eficaces como máscara cuando el ruido es más potente que el habla, y a altos niveles de presión sonora afectan tanto las vocales como las consonantes. Esta es la causa por la cual el efecto de proximidad de los micrófonos cardioides puede ser tan perjudicial para la inteligibilidad del habla: causa que la señal se enmascare a sí misma. Mientras que los micrófonos cardioides son muy útiles para minimizar la captación de ruido cercana a la fuente sonora, deben ser utilizados con un filtro pasa altos bastante pronunciado (12 dB/ octava o mayor) centrado alrededor de 100 Hz (o más arriba, si el rango de la voz del orador lo permite) para que el efecto de proximidad sea minimizado.

Una voz humana que emite un mensaje que compite con aquel otro que nos interesa escuchar- podemos llamarla "perturbadora"- es también muy buena para enmascarar el habla- particularmente en niveles iguales o inferiores a 0 dB de relación señal a ruido. Además, el efecto de enmascaramiento aumenta con el número de voces "perturbadoras". El siguiente diagrama compara el enmascaramiento producido por una, dos y tres voces. Nótese que, por debajo de 0 dB de relación señal a ruido, tres voces actúan tan eficazmente enmascarando al igual que un ruido de banda ancha. Por encima de 0 dB, sin embargo, la inteligibilidad mejora rápidamente según aumenta la relación señal a ruido. Esto nos ilustra acerca de la importancia de disponer de suficiente potencia para que el sistema de sonido supere el ruido de una multitud.

La dirección desde la cual el sonido enmascarante llega, relativa a la dirección de la señal hablada, puede afectar el grado de enmascaramiento. Si el ruido proviene del mismo lugar, el enmascaramiento es mayor; disminuye cuando la distancia entre la fuente de ruido y la señal hablada aumenta pues esto facilita al cerebro la discriminación entre ambas. El enmascaramiento es más bajo en el caso de que la exposición sea escuchada con auriculares, el habla en un oído y el ruido en el otro. (Desafortunadamente, no podemos aplicar este mecanismo en los sistemas de refuerzo de sonido).

De lo dicho hasta ahora, podemos concluir porqué la reverberación es tan destructiva para la inteligibilidad, especialmente más allá de la distancia crítica. Siendo causada por el habla, la reverberación imita el espectro de ésta, pero generalmente con mayor energía en bajas frecuencias. Una porción suficiente de reverberación y eco - tal como encontramos en catedrales y grandes estadios deportivos - pueden realmente funcionar como múltiples voces "perturbadoras". Además, por su naturaleza, la energía reverberante llega desde todos los ángulos y, por lo tanto, es difícil de separar de la señal hablada utilizando indicadores direccionales.

Respuesta de Frecuencia

Uno de los factores más obvios en el funcionamiento de los sistemas de sonido que afecta la inteligibilidad es la respuesta de frecuencia. Aquellos sistemas cuyo ancho de banda es extremadamente limitado reproducen el habla pobremente. Por ejemplo, los teléfonos están por lo general limitados a un ancho de banda de 2 KHz, y ello dificulta la distinción entre el sonido de las "f" y la "s" o las "d" y las "t".

Los sistemas de alta fidelidad para reproducción de voces necesitan abarcar el rango desde aproximadamente 80 Hz (especialmente para las voces masculinas profundas) hasta aproximadamente 10 Khz ( para una buena reproducción de consonantes, que son cruciales para la inteligibilidad). La respuesta por debajo de 80 hz debe ser atenuada lo máximo posible: no sólo estas frecuencias se encuentran fuera del rango de la señal del habla, sino que además pueden causar especialmente enmascaramiento, que puede ser muy destructivo a altos niveles de presión sonora.

También es muy importante que la respuesta del sistema sea razonablemente plana a lo largo de todo su rango. La atenuación gradual que presentan en altas frecuencias algunos sistemas de sonido en los cuales se prioriza la reproducción de música grabada, puede causar una disminución de la presencia de las consonantes que de por sí, son aproximadamente 27 dB menos potentes que las vocales. Asímismo, picos o depresiones muy pronunciadas en la respuesta de frecuencia del sistema pueden causar tanto auto-enmascaramiento como pérdida de articulación de las consonantes.

Finalmente, la cobertura del sistema debe ser consistente a lo largo del área que ocupan los oyentes, con cancelaciones mínimas en la respuesta o atenuación fuera del eje en las frecuencias altas críticas. Estos requerimientos muchas veces dictaminan el uso de sistemas distribuidos o dirigidos muy cuidadosamente y también de sistemas retardados. El uso de altavoces con ángulos de cobertura estrechos, ayudará a elevar la relación señal a ruido entre el habla y los niveles de reverberación.

Distorsión

Estudios recientes sobre la inteligibilidad en sistemas de comunicación sugieren que recortando los picos de la señal y luego amplificándola para recuperar su amplitud pico a pico mejora la inteligibilidad. Este "truco" funciona en ambientes ruidosos pues el recorte genera tonos parciales que están armónicamente relacionados con la frecuencia fundamental (distorsión armónica por saturación) y por lo tanto son menos probables de enmascarar el habla- y porque acentúan las consonantes e incrementan la potencia sonora de la señal. Ello ha sido de ayuda para los sistemas de comunicación de banda limitada que son utilizados en ambientes muy ruidosos, como por ejemplo, la cubierta de un portaaviones.

El hecho es, sin embargo, que saturar la señal para mejorar la inteligibilidad funciona solo en los casos donde la relación señal a ruido es muy pobre. Aquí podemos ver un gráfico que nos muestra la articulación de las palabras contra la relación señal a ruido para una señal saturada infinitamente y para una señal no saturada. Nótese que el valor de inteligibilidad para la señal saturada se acerca a un 50 % a 0 dB de relación señal a ruido; cerca de los +3 dB de relación señal a ruido, la señal no saturada logra un valor mejor.

En el funcionamiento real de sistemas de refuerzo de sonido para palabras, la saturación debe ser evitada. Obviamente, sonará objetable en un sistema de alta calidad. Además incrementará el enmascaramiento producido por cualquier sonido que sea captado por el micrófono, ya que ese ruido será saturado junto con la señal del habla.

Otro tipo de distorsión que es muy destructiva para la inteligibilidad es la distorsión por intermodulación. Mientras que ésta puede ser controlada fácilmente en la electrónica del sistema, un grado significativo de IM puede ser generado cuando algunos tipos de altavoces (particularmente los coaxiales de 2 vías) son operados a altos niveles de potencia. La IM genera sumas y diferencias de productos que no están armónicamente relacionados a la frecuencia fundamental. De este modo tienen un efecto de máscara mayor que los productos armónicos generados por la saturación.

Respuesta relativa al tiempo

Quizás porque es escasamente comprendida y sus efectos son más sutiles, la respuesta de fase en sistemas de comunicación ha recibido escasa atención. De hecho, muchas de las publicaciones acerca de "fase" e inteligibilidad, en realidad tratan sobre los efectos de la polaridad relativa. Se ha observado, por ejemplo, que cuando la señal del habla es escuchada con ruido en auriculares, la inteligibilidad aumenta alrededor del 25% si se invierte la polaridad de esa señal en un oído, con respecto al otro. Este efecto no tiene aplicación en los sistemas de refuerzo de sonido, excepto en los monitores intra-auriculares.

Te Invitamos a Enviar Tus Comentarios Sobre Estos Artículos
y esperamos crear con ello un foro de discusión.

Siguiente Sección



Footer


homepage inicio productos sound lab noticias company suporte ventas/rentas contactos solicita informacion contacto terminos de uso marcas registradas