Бұл жұмыста нақты акустикалық ортада жазылған балалардың сөйлеу сапасын жақсартуға арналған гибридті шуды азайту алгоритмін ұсынылған. Алгоритм жылдам Фурье түрлендіруі (FFT) және Винер сүзгісі сияқты дәстүрлі спектрлік талдау әдістерін қайталанатын нейрондық желілерді (RNN) және ұзақ мерзімді қысқа мерзімді жады (LSTM) желілерін қоса алғанда, терең оқыту тәсілдерімен біріктіреді. Ұсынылған әдістің тиімділігін бағалау үшін арнайы әзірленген "Dataset Loader" Telegram-ботын пайдалана отырып, қазақ тіліндегі балалар сөйлеуінің аудио корпусы жиналды. Зерттеудің эксперименттік бөлігі шуды азайту алгоритмін қолданғаннан кейін сөйлеуді тану көрсеткіштерінің айтарлықтай жақсарғанын көрсетті. Атап айтқанда, сөзді тану қателіктерінің жиілігі (WER) 32.4%-дан 18.7% - ға дейін төмендеді, ал F1-score 0.72-ден 0.88-ге дейін өсті. Спектрограммаларды талдау фондық шу деңгейінің айқын төмендеуін және сөйлеудің оқылуының жақсарғанын көрсетті. Зерттеу нәтижелері сөйлеу деректерінің сапасын жақсарту және күрделі акустикалық жағдайларда сөйлеуді автоматты түрде тану жүйелерінің дәлдігін жақсарту үшін гибридті тәсілдің тиімділігін растайды.
БАЛАЛАРДЫҢ СӨЙЛЕУІН ТАНУ ЖҮЙЕЛЕРІНДЕГІ ШУДЫ АЗАЙТУ АЛГОРИТМДЕРІН ТАЛДАУ ЖӘНЕ ЖАҚСАРТУ
Жарияланған September 2025
6
3
Аңдатпа
Тіл
Русский
Як цитувати
[1]
Рахимова, Д., Дүйсенбекқызы, Ж., Сағынтай, О., Турарбек, Ә. і Төлеуғали , Ш. 2025. БАЛАЛАРДЫҢ СӨЙЛЕУІН ТАНУ ЖҮЙЕЛЕРІНДЕГІ ШУДЫ АЗАЙТУ АЛГОРИТМДЕРІН ТАЛДАУ ЖӘНЕ ЖАҚСАРТУ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 91, 3 (Вер 2025), 230–242. DOI:https://doi.org/10.51889/2959-5894.2025.91.3.021.
https://orcid.org/0000-0003-1427-198X