Wavelet-Analyse und COPRAS für verbesserte Spracherkennung in maskierten Umgebungen

Bearbeitet von: Liliya Shabalina lilia

Die Wavelet-Analyse ist ein leistungsstarkes Werkzeug zur Analyse von Sprach- und akustischen Signalen, das besonders nützlich ist, wenn die Sprachverständlichkeit durch Faktoren wie Gesichtsmasken beeinträchtigt wird. Die COVID-19-Pandemie hat die Herausforderungen verdeutlicht, die Masken für eine klare Kommunikation darstellen. Die Wavelet-Transformation (WT) bietet eine Lösung, indem sie Zeit- und Frequenzbereichsdaten integriert, um die Spracherkennung zu verbessern.

Die Auswahl einer geeigneten "Mutter-Wavelet" ist entscheidend für eine effektive WT, da verschiedene Wavelets unterschiedliche Ergebnisse liefern. Die Forschung nutzt die COPRAS-Technik (COmplex PRoportional ASsessment), um die optimale Mutter-Wavelet-Funktion für Sprachsignale zu bestimmen, wenn Gesichtsmasken oder -schilde verwendet werden.

Metriken wie der maximale Kreuzkorrelationskoeffizient (MCC) und das maximale Energie-zu-Shannon-Verhältnis (MEER) werden verwendet, um die Mutter-Wavelet-Funktionen zu bewerten. Diese Methode legt ein klares Protokoll für die Auswahl der am besten geeigneten Mutter-Wavelets für Sprachsignale unter verschiedenen realen Bedingungen fest, in denen Masken vorhanden sein können. Wavelet-Transformationen verbessern Mustererkennungssysteme, indem sie Merkmale extrahieren, die gegenüber bestimmten Transformationen invariant sind, und können die Leistung von Klassifikatoren in verrauschten Umgebungen verbessern.

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.