Glosario de Términos
| %ALcons |
Prueba de Diagnóstico por Rima
Relación de Sonido Directo a Reverberante |
Enmascaramiento | RT60 |
Porcentaje de Pérdida de Articulación de las Consonantes. Esta medición por instrumentación de la inteligibilidad está cercanamente asociada al analizador TEF. Es calculada a partir de mediciones de la Relación de Sonido Directo a Reverberante y del Tiempo de Caída Temprana usando un conjunto de correlaciones definidas por SynAudCon, y es especificada como un porcentaje.
Ya que %ALcons expresa pérdida de la definición de las consonantes, los valores más bajos están asociados con una mayor inteligibilidad. Se asume por lo general que el máximo valor permitido para aplicaciones típicas de voceo es del 10%, asumiendo que el ambiente está relativamente libre de ruido enmascarante. Para ambientes de aprendizaje y sistemas de alarma por voz, el valor deseado es 5% o menos.
Articulación de Palabras se refiere al número de palabras de prueba identificadas correctamente en una prueba de inteligibilidad. Es expresada como porcentaje.
El término articulación se refiere también a la calidad de la pronunciación de un hablante. A mayor articulación de un hablante dado (las consonantes son claras y distintivas, las vocales son claramente articuladas y no arrastradas), más inteligible será su habla.
Fue uno de los primeros intentos por medir mediante instrumentación la inteligibilidad de un sistema de transmisión del habla, el Indice de Articulación fue desarrollado por Bell Telephone Laboratories en los 1940s.
AI está basado en la idea de que la respuesta de un sistema de comunicación hablada puede ser dividido en veinte bandas de frecuencia, cada una de las cuales aporta una contribución independiente a la inteligibilidad del sistema, y que la contribución total de todas las bandas es la suma de las contribuciones de las bandas individuales. (AI puede también ser medida usando bandas de un tercio de octava o de una octava). Las Relaciones señal a ruido son calculadas para cada banda individual, y después poderadas y combinadas para dar una evaluación de la inteligibilidad.
El AI varía de valor desde 0 (completamente ininteligible) hasta 1 (inteligibilidad perfecta). Un AI de 0.3 o menor es considerado insatisfactorio, de 0.3 a 0.5 satisfactorio, de 0.5 a 0.7 bueno, y mayor a 0.7 de muy bueno a excelente.
Es una oración utilizada para presentar palabras de prueba en pruebas estadísticas de inteligibilidad (por ejemplo, ¿Escribirías <palabra de prueba> ahora?). La palabra de prueba es pronunciada sin énfasis, y la oración es la misma para cada palabra de prueba. La oración ortadora asegura que el campo reverberante se excitado antes de que la palabra de prueba sea hablada, de manera que sus efectos sean apropiadamente tomados en cuenta para la prueba. También permite que los procesadores de dinámica como controles automáticos de ganancia o compresores se activen y estabilícen.
El término distancia crítica se refiere a la distancia desde un altavoz en un espacio cerrado a la que la reverberación es igual en intensidad al sonido directo desde el altavoz. Más allá de esta distancia, la energía reverberante tiende a enmascarar el sonido directo.
En realidad, debido a que el sonido reflejado pierde energía por absorción sobre las superficies (y también viaja una trayectoria mayor hasta el escucha, incurriendo así en mayores pérdidas por absorción en el aire), la energía reverberante del estímulo sonoro de un pulso discreto nunca puede igualar al sonido directo sobre una base instantánea. En ambientes altamente reflejantes, sin embargo, la intensidad de la reverberación estática puede fácilmente exceder la del sonido directo en varios puntos del espacio. Esto degrada la relación señal a ruido y destruye la inteligibilidad.
Prueba de Diagnóstico por Aliteración (DALT)
El DALT se deriva de la Prueba de Diagnóstico por Rima. Emplea una lista de noventa y seis parejas de palabras monosilábicas que difieren únicamente en sus consonantes finales (por ejemplo, art-arc). Estas diferencias están organizadas en seis categorías, y la evaluación de cada categoría puede ser usada para identificar problemas específicos en un sistema de comunicación. Promediadas juntas, las seis evaluaciones proporcionan una sola medición inteligibilidad. Como en la DRT, a los escuchas se les muestra una pareja de palabras, y después se les pide que identifiquen las palabras que les son presentadas por el orador. No se usan oraciones portadoras.
Prueba de Diagnóstico por Consonantes Centrales (DMCT)
La DMCT se deriva de la Prueba de Diagnóstico por Rima. Utiliza una lista de noventa y seis parejas de palabras de dos sílabas que difieren únicamente en la consonante central (por ejemplo, bobble-bottle). Estas diferencias están organizadas en seis categorías, y la evaluación de cada categoría puede ser usada para identificar problemas específicos en un sistema de comunicación. Promediadas juntas, las seis evaluaciones proporcionan una medida única de la inteligibilidad. Como en la DRT, a los escuchas se les muestra una pareja de palabras, y después se les pide que identifiquen las palabras que les son presentadas por el orador. No se usan oraciones portadoras.
Prueba de Diagnóstico por Rima (DRT)
De manera similar a la Prueba de Diagnóstico por Rima Modificada, la DRT utiliza palabras Inglesas monosilábicas construidas a partir de una secuencia de sonidos consonante-vocal-consonante. En la DRT, ciento noventa y dos palabras son ordenadas en noventa y seis parejas de rimas que difieren únicamente en sus consonantes iniciales (puedes consultar la lista de palabras de la DRT aquí). A los escuchas se les muestra una pareja de palabras, y después se les pide que identifiquen las palabra que les son presentadas por el orador. No se usan oraciones portadoras.
La DRT está basada en varias características distintivas del habla, y los resultados de sus pruebas revelan errores en la discriminación de los sonidos de las consonantes iniciales. La prueba puede ser presentada en un periodo corto de tiempo y puede ser evaluada de varias maneras diferentes.
Este término se refiere al sonido que llega a través de una trayectoria acústica directa desde la fuente hasta el escucha en un espacio cerrado (i.e. sin la intervención de reflexiones en las delimitaciones del espacio). El sonido directo es la señal deseada en un sistema de refuerzo del habla (ver también relación de sonido directo a reverberante, reverberación, relación señal a ruido, enmascaramiento).
Relación de Sonido Directo a Reverberante
Es la relación entre las intensidades del sonido directo y la reverberación. Existen varias mediciones de esta cantidad. C50, es una de las más populares, expresa la claridad del sonido como la proporción de energía de los primeros 50 milisegundos de sonido directo con la reverberación estática general, siendo 0 dB el mínimo valor aceptable y +4 dB o mayor el valor preferido. Una medida similar, C7, es usada en Alemania; y C35 es otra versión más. Las mediciones son realizadas en una sola banda de frecuencia (usualmente cebtrada en 1 kHz). Cada una de estas mediciones puede ser más confiable y repetible que %ALcons, la cual también se ocupa de la relación de sonido directo a reverberante.
Discriminación se refiere a la habilidad de un escucha para discernir entre palabras o frases homófonas en una prueba de inteligibilidad del habla.
Tiempo de Caída Temprana (EDT)
Es una medición de la reverberación, la EDT es el tiempo que le toma a la energía reverberante en una sala disminuir por 10 dB desde su valor estáticos (ver RT60).
Relación de Sonido Temprano a Tardío (ELR)
Propuesto en 1996 por G. Marshall, la ELR es similar a la C50 pero es ponderada para el habla e incluye mediciones en más de una banda de frecuencia. Como con otros métodos de medición del sonido directo a reverberante, sin embargo, no se consideran factores diferentes a la reverberación.
Es el grado al cual el habla puede ser entendida. Con referencia particular a la especificación y prueba de sistemas de comunicación hablada, la inteligibilidad denota el grado al cual los escuchas entrenados pueden identificar palabras o frases habladas por oradores entrenados y transmitidas a los escuchas a través de un sistema de comunicaciones.
En la mayoría de los sistemas prácticos de comunicación hablada, pueden ser introducidos sonidos indeseados por una variedad de fuentes (como se muestra en este diagrama). Estos sonidos indeseados reducen la sensibilidad del escucha al habla transmitida, degradando así la inteligibilidad. El efecto se llama enmascaramiento, y es descrito en detalle en la Sección II.
Prueba por Rima Modificada (MRT)
Es una lista de palabras para pruebas estadísticas de inteligibilidad. La Prueba por Rima Modificada utiliza cincuenta listas de seis rimas o palabras homófonas Inglesas, como se muestra aquí. Cada palabra está construida a partir de una secuencia de sonidos consonante-vocal-consonante, y las seis palabras de cada lista difiere únicamente en el sonido de la consonante inicial o final. A los escuchas se les muestra una lista de seis palabras y se les pide que identifiquen cual de la seis es hablada por el orador. Usualmente se usa una oración portadora.
Los resultados de la MRT indican errores en la discriminación de sonidos consonantes iniciales y finales. Las respuestas de los escuchas pueden ser evaluadas como (1) el número de palabras escuchadas correctamente; (2) el número de palabras escuchadas incorrectamente; o (3) la frecuencia de confusiones particulares de sonidos consonantes.
Es cualquier señal o sonido introducidos en un sistema de comunicaciones o ambiente de lenguaje hablado. Las fuentes del ruido son muchas, y pueden ser tanto acústicas (inducción de AC de alto voltaje, sonidos callejeros, ruido de muchedumbre, reverberación y ecos, etc.) yb electrónicos (ruido térmico o hiss, hum, etc). El ruido puede estar correlacionado con la señal hablada deseada (reverberación) o puede no estar correlacionada (ruido de fondo, murmullos).
Es la unidad más pequeña del habla que, si es alterada, cambia el significado de la palabra.
Lista de Palabras Fonéticamente Balanceadas (PB)
El conjunto de las veinte listas de palabras fonéticamente balanceadas fue desarrollado durante la Segunda Guerra Mundial, y ha sido utilizado ampliamente desde entonces en pruebas estadísticas de la inteligibilidad. Aquí puedes ver las primeras cuatro listas PB. Las palabras de cada lista son presentadas en un orden nuevo y aleatorio cada vez que las listas son usadas, cada una dentro de la misma oración portadora.
La prueba PB de inteligibilidad requiere de mayor entrenamiento para los escuchas y los oradores que otras pruebas estadísticas, y es particularmente sensible a la relación señal a ruido: un cambio relativamente pequeño en la relación señal a ruido causa un cambio grande en la evaluación de inteligibilidad.
Indice Rápido de Transmisión del Habla, es un método de prueba mediante instrumentación para probar la inteligibilidad en sistemas de sonido que está asociado con Brüel and Kjaer, la compañía de instrumentación que fabrica un aparato portátil para implementarlo.
RASTI fue desarrollado como una alternativa más sencilla al más complejo STI (Indice de Transmisión del Habla). En contraste con STI, RASTI mide únicamente en dos bandas de un tercio de octava centradas en 500 Hz y 2 kHz, respectivamente. Utiliza una señal de excitación semejante al habla y, al igual que STI, correlaciona las reducciones en la profundidad de la modulación con la pérdida de la inteligibilidad.
La reverberación es la persistencia del sonido en un espacio cerradouna vez que el sonido de la excitación original ha cesado. Consiste de una serie de reflexiones, o ecos, espaciados muy cercanamente, cuya intensidad disminuye a través del tiempo debido a la absorción sobre las superficies y las pérdidas por absorción en el aire.
Es el método estándar para especificar el tiempo de reverberación, RT60 es la cantidad de tiempo que le toma a la energía reverberante en un espacio cerrado caer por 60 dB desde su valor estático inicial, una vez que el sonido original ha cesado. Las grandes salas con superficies duras y altamente reflejantes (como las catedrales) tienen tiempos de reverberación largos, mientras que las salas más pequeñas con superficies absorbentes tienen tiempos de reverberación cortos. Aquí puedes ver un diagrama que da valores preferidos de RT60 para diversas aplicaciones.
Es la proporción entre la intensidad de la señal hablada deseada y la del ruido introducido, expresada en decibeles. A 0 dB las dos tienen igual intensidad; los valores negativos están asociados con la pérdida de la inteligibilidad debido al enmascaramiento. Los valores positivos están asociados usualmente con una mejor inteligibilidad.
Indice de Inteligibilidad del Habla (SII)
Derivado y en esencia idéntico a STI, SII es el método mediante instrumentación para medir la inteligibilidad del habla que actualmente está propuesto como Estándar ANSI S3.5-1997.
En el Estándar, se permiten cuatro procedimientos de medición, cada uno usa un número y un tamaño diferente de bandas de frecuencia. En orden descendente de precisión, ellos son:
- Banda Crítica (21 bandas)
- Bandas de un tercio de octava (18 bandas)
- Banda crítica de igual contribución (17 bandas)
- Banda de una octava (6 bandas)
Prueba de Deletreo Alfabético (SpAT)
SpAT es una prueba desarrollada por la Armada de los Estados Unidos para pruebas estadísticas de inteligibilidad que usa una lista de palabras conocida como ICAO. Los escuchas responden escribiendo la palabra o dígito hablados, o presionando la primera letra de la palabra o número en un teclado.
Desarrollado a principios de los 1970s, el Indice de Transmisión del Habla (STI) es una medición mediante instrumentación de la inteligibilidad, cuyos valores varían desde 0 (completamente ininteligible) hasta 1 (inteligibilidad perfecta).
En las pruebas STI, el habla es modelada por una señal de prueba especial con características semejantes a la señal del habla. Partiendo del concepto de que el habla puede ser descrita como una forma de onda fundamental modulada por señales de baja frecuencia, STI utiliza un complejo esquema de modulación de amplitud para generar su señal de prueba. En el extremo receptor del sistema de comunicación, la profundidad de la modulación de la señal recibida es comparada con la de la señal de prueba en cada una de varias bandas de frecuencia. Las reducciones en la profundidad de la modulación son asociadas con una pérdida de la inteligibilidad.
Relación de Sonido Util a Destructivo (U50 or U80)
Es la proporción logarítmica entre la energía de los sonidos que son útiles para la inteligibilidad y aquellos que son dañinos para ella, expresada en decibeles.
Los sonidos útiles son la energía integrada de los sonidos del habla que llegan dentro de los primeros 50 u 80 milisegundos después del sonido directo, y los sonidos dañinos son la suma de la energía tardía del habla y el ruido ambiental. En la práctica, ambas cantidades pueden ser calculadas al integrar las porciones apropiadas de la respuesta de impulso de la sala.