Phân tích Wavelet và COPRAS để tăng cường nhận dạng giọng nói trong môi trường có đeo khẩu trang

Chỉnh sửa bởi: Liliya Shabalina lilia

Phân tích Wavelet và COPRAS để tăng cường nhận dạng giọng nói trong môi trường có đeo khẩu trang

Phân tích Wavelet là một công cụ mạnh mẽ để phân tích giọng nói và tín hiệu âm thanh, đặc biệt hữu ích khi khả năng nghe hiểu giọng nói bị ảnh hưởng bởi các yếu tố như khẩu trang. Đại dịch COVID-19 đã làm nổi bật những thách thức mà khẩu trang gây ra đối với giao tiếp rõ ràng. Biến đổi Wavelet (WT) cung cấp một giải pháp bằng cách tích hợp dữ liệu miền thời gian và tần số để cải thiện khả năng nhận dạng giọng nói.

Việc lựa chọn một "wavelet mẹ" phù hợp là rất quan trọng để WT hoạt động hiệu quả, vì các wavelet khác nhau sẽ cho ra các kết quả khác nhau. Nghiên cứu tận dụng kỹ thuật COPRAS (COmplex PRoportional ASsessment) để xác định hàm wavelet mẹ tối ưu cho tín hiệu giọng nói khi sử dụng khẩu trang hoặc tấm chắn.

Các số liệu như Hệ số tương quan chéo tối đa (MCC) và Tỷ lệ năng lượng tối đa trên Shannon (MEER) được sử dụng để xếp hạng các hàm wavelet mẹ. Phương pháp này thiết lập một giao thức rõ ràng để chọn các wavelet mẹ phù hợp nhất cho tín hiệu giọng nói trong các điều kiện thực tế đa dạng, nơi có thể có khẩu trang. Biến đổi Wavelet cải thiện hệ thống nhận dạng mẫu bằng cách trích xuất các đặc trưng bất biến đối với một số phép biến đổi nhất định và có thể cải thiện hiệu suất của bộ phân loại trong môi trường ồn ào.

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.