Waveletanalyse en COPRAS voor verbeterde spraakherkenning in gemaskerde omgevingen

Bewerkt door: Liliya Shabalina lilia

Waveletanalyse en COPRAS voor verbeterde spraakherkenning in gemaskerde omgevingen

Waveletanalyse is een krachtig hulpmiddel voor het analyseren van spraak- en akoestische signalen, vooral handig wanneer de verstaanbaarheid van spraak wordt belemmerd door factoren zoals gezichtsmaskers. De COVID-19-pandemie benadrukte de uitdagingen die maskers vormen voor duidelijke communicatie. Wavelet Transform (WT) biedt een oplossing door tijd- en frequentiedomeingegevens te integreren om spraakherkenning te verbeteren.

De selectie van een geschikte "moederwavelet" is cruciaal voor effectieve WT, aangezien verschillende wavelets verschillende resultaten opleveren. Onderzoek maakt gebruik van de COPRAS (COmplex PRoportional ASsessment) techniek om de optimale moederwaveletfunctie voor spraaksignalen te bepalen wanneer gezichtsmaskers of schilden worden gebruikt.

Metrieken zoals Maximum Cross-Correlation Coefficient (MCC) en Maximum Energy to Shannon Ratio (MEER) worden gebruikt om de moederwaveletfuncties te rangschikken. Deze methode stelt een duidelijk protocol vast voor het selecteren van de meest geschikte moederwavelets voor spraaksignalen in diverse, real-world omstandigheden waar maskers aanwezig kunnen zijn. Wavelettransformaties verbeteren patroonherkenningssystemen door kenmerken te extraheren die invariant zijn voor bepaalde transformaties en kunnen de prestaties van classificatoren in lawaaierige omgevingen verbeteren.

Heb je een fout of onnauwkeurigheid gevonden?

We zullen je opmerkingen zo snel mogelijk in overweging nemen.