Análisis de Wavelet y COPRAS para el Reconocimiento de Voz Mejorado en Entornos Enmascarados

Editado por: Liliya Shabalina lilia

El análisis de wavelet es una herramienta poderosa para analizar el habla y las señales acústicas, particularmente útil cuando la inteligibilidad del habla se ve comprometida por factores como las máscaras faciales. La pandemia de COVID-19 destacó los desafíos que plantean las máscaras para una comunicación clara. La Transformada Wavelet (WT) ofrece una solución al integrar datos del dominio del tiempo y la frecuencia para mejorar el reconocimiento de voz.

La selección de una "wavelet madre" apropiada es fundamental para una WT eficaz, ya que diferentes wavelets producen resultados variables. La investigación aprovecha la técnica COPRAS (COmplex PRoportional ASsessment) para determinar la función de wavelet madre óptima para las señales de voz cuando se utilizan máscaras o protectores faciales.

Se emplean métricas como el Coeficiente de Correlación Cruzada Máxima (MCC) y la Relación Máxima de Energía a Shannon (MEER) para clasificar las funciones de wavelet madre. Este método establece un protocolo claro para seleccionar las wavelets madre más adecuadas para las señales de voz en diversas condiciones del mundo real donde pueden estar presentes máscaras. Las transformadas wavelet mejoran los sistemas de reconocimiento de patrones al extraer características que son invariantes a ciertas transformaciones y pueden mejorar el rendimiento de los clasificadores en entornos ruidosos.

¿Encontró un error o inexactitud?

Consideraremos sus comentarios lo antes posible.