В данной работе представлен гибридный алгоритм шумоподавления для улучшения качества детской речи, записанной в реальной акустической среде. Алгоритм сочетает традиционные методы спектрального анализа, такие как быстрое преобразование Фурье (БПФ) и фильтр Винера, с подходами глубокого обучения, включая рекуррентные нейронные сети (RNN) и сети с долго-краткосрочной памятью (LSTM). Для оценки эффективности предлагаемого метода был собран аудиокорпус детской речи на казахском языке с помощью специально разработанного Telegram-бота «Dataset Loader». Экспериментальная часть исследования показала значительное улучшение показателей распознавания речи после применения алгоритма шумоподавления. В частности, показатель ошибок распознавания слов (WER) снизился с 32,4% до 18,7%, а показатель F1 увеличился с 0,72 до 0,88. Анализ спектрограмм показал явное снижение уровня фонового шума и улучшение разборчивости речи. Результаты исследования подтверждают эффективность гибридного подхода для улучшения качества речевых данных и повышения точности систем автоматического распознавания речи в сложных акустических условиях.
АНАЛИЗ И УЛУЧШЕНИЕ АЛГОРИТМОВ ШУМОПОДАВЛЕНИЯ В СИСТЕМАХ РАСПОЗНАВАНИЯ РЕЧИ ДЕТЕЙ
Опубликован September 2025
4
3
Аннотация
Язык
Русский
Как цитировать
[1]
Рахимова, Д., Дүйсенбекқызы, Ж., Сагынтай, О., Турарбек, Ә. и Төлеуғали , Ш. 2025. АНАЛИЗ И УЛУЧШЕНИЕ АЛГОРИТМОВ ШУМОПОДАВЛЕНИЯ В СИСТЕМАХ РАСПОЗНАВАНИЯ РЕЧИ ДЕТЕЙ. Вестник КазНПУ имени Абая. Серия: Физико-математические науки. 91, 3 (сен. 2025), 230–242. DOI:https://doi.org/10.51889/2959-5894.2025.91.3.021.
https://orcid.org/0000-0003-1427-198X