Analiza falkowa i COPRAS dla poprawy rozpoznawania mowy w środowiskach z maskami

Edytowane przez: Liliya Shabalina lilia

Analiza falkowa i COPRAS dla poprawy rozpoznawania mowy w środowiskach z maskami

Analiza falkowa to potężne narzędzie do analizy mowy i sygnałów akustycznych, szczególnie przydatne, gdy zrozumiałość mowy jest ograniczona przez czynniki takie jak maski na twarz. Pandemia COVID-19 uwypukliła wyzwania, jakie maski stwarzają dla jasnej komunikacji. Transformata falkowa (WT) oferuje rozwiązanie poprzez integrację danych z dziedziny czasu i częstotliwości w celu poprawy rozpoznawania mowy.

Wybór odpowiedniej „falki macierzystej” ma kluczowe znaczenie dla skutecznej WT, ponieważ różne falki dają różne wyniki. Badania wykorzystują technikę COPRAS (COmplex PRoportional ASsessment) w celu określenia optymalnej funkcji falki macierzystej dla sygnałów mowy, gdy używane są maski lub osłony na twarz.

Metryki takie jak maksymalny współczynnik korelacji krzyżowej (MCC) i maksymalny stosunek energii do Shannon (MEER) są wykorzystywane do rankingu funkcji falki macierzystej. Ta metoda ustanawia jasny protokół wyboru najbardziej odpowiednich falek macierzystych dla sygnałów mowy w różnych, rzeczywistych warunkach, w których mogą być obecne maski. Transformacje falkowe poprawiają systemy rozpoznawania wzorców poprzez wydobywanie cech, które są niezmienne na pewne transformacje i mogą poprawić wydajność klasyfikatorów w środowiskach zaszumionych.

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.