Вейвлет-аналіз та COPRAS для покращеного розпізнавання мовлення в умовах використання масок

Відредаговано: Liliya Shabalina lilia

Вейвлет-аналіз та COPRAS для покращеного розпізнавання мовлення в умовах використання масок

Вейвлет-аналіз є потужним інструментом для аналізу мовленнєвих та акустичних сигналів, особливо корисний, коли розбірливість мовлення погіршується такими факторами, як маски для обличчя. Пандемія COVID-19 підкреслила проблеми, які маски створюють для чіткої комунікації. Вейвлет-перетворення (WT) пропонує рішення, інтегруючи дані часової та частотної областей для покращення розпізнавання мовлення.

Вибір відповідного "материнського вейвлета" є критичним для ефективного WT, оскільки різні вейвлети дають різні результати. Дослідження використовують техніку COPRAS (COmplex PRoportional ASsessment) для визначення оптимальної материнської вейвлет-функції для мовленнєвих сигналів, коли використовуються маски або щитки для обличчя.

Метрики, такі як максимальний коефіцієнт взаємної кореляції (MCC) та максимальне відношення енергії до Шеннона (MEER), використовуються для ранжування материнських вейвлет-функцій. Цей метод встановлює чіткий протокол для вибору найбільш підходящих материнських вейвлетів для мовленнєвих сигналів у різноманітних реальних умовах, де можуть бути присутні маски. Вейвлет-перетворення покращують системи розпізнавання образів, витягуючи ознаки, які є інваріантними до певних перетворень, і можуть покращити продуктивність класифікаторів у шумному середовищі.

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.