Die Wavelet-Analyse ist ein leistungsstarkes Werkzeug zur Analyse von Sprach- und akustischen Signalen, das besonders nützlich ist, wenn die Sprachverständlichkeit durch Faktoren wie Gesichtsmasken beeinträchtigt wird. Die COVID-19-Pandemie hat die Herausforderungen verdeutlicht, die Masken für eine klare Kommunikation darstellen. Die Wavelet-Transformation (WT) bietet eine Lösung, indem sie Zeit- und Frequenzbereichsdaten integriert, um die Spracherkennung zu verbessern.
Die Auswahl einer geeigneten "Mutter-Wavelet" ist entscheidend für eine effektive WT, da verschiedene Wavelets unterschiedliche Ergebnisse liefern. Die Forschung nutzt die COPRAS-Technik (COmplex PRoportional ASsessment), um die optimale Mutter-Wavelet-Funktion für Sprachsignale zu bestimmen, wenn Gesichtsmasken oder -schilde verwendet werden.
Metriken wie der maximale Kreuzkorrelationskoeffizient (MCC) und das maximale Energie-zu-Shannon-Verhältnis (MEER) werden verwendet, um die Mutter-Wavelet-Funktionen zu bewerten. Diese Methode legt ein klares Protokoll für die Auswahl der am besten geeigneten Mutter-Wavelets für Sprachsignale unter verschiedenen realen Bedingungen fest, in denen Masken vorhanden sein können. Wavelet-Transformationen verbessern Mustererkennungssysteme, indem sie Merkmale extrahieren, die gegenüber bestimmten Transformationen invariant sind, und können die Leistung von Klassifikatoren in verrauschten Umgebungen verbessern.