Кәдімгі сөзді автоматты түрде тану (ағыл. ASR - automatic speech recognition) жүйелері акустикалық модельдеу үшін GMM-HMM (ағыл. Gaussian Mixture Model- Hidden Markov model) және тілді модельдеу үшін n-gram қолданады. Соңғы онжылдықта терең бағытталған нейрондық желі (ағыл. Deep feed-forward neural network - DFNN) акустикалық модельдеуде GMM-ді (ағыл. Generalized Method of Moments), яғни математикалық статистика мен эконометрикада үлестірудің белгісіз параметрлерін және эконометрикалық модельдерді бағалау әдісін толық дерлік ауыстырды. Қазіргі автоматты түрде тану жүйелері негізінен DFNN-HMM акустикалық моделіне және n-gram тіл үлгісіне (ағыл. LM – language model) негізделген. Ұзақ қысқамерзімді контекстті модельдеу мүмкіндігінің арқасында қайталанатын нейрондық желіге (ағыл. RNN - recurrent neural network) негізделген тіл үлгілері n-gram тіл үлгілеріне қарағанда төмен түсініксіздікті береді деп хабарланған. Жақында қайталанатын нейрондық желінің нұсқасы, ұзақ қысқамерзімді жады (ағыл. LSTM - longshort term memory) акустикалық модельдеуде сәтті зерттелді. Бір қызығы, қайталанатын нейрондық желіге негізделген акустикалық және лингвистикалық модельдеуді қолданатын автоматты сөйлеуді тану жүйесін бағалау әлі хабарланбаған. Сонымен қатар, біз бұл жетістіктердің көпшілігі ересектердің сөйлеуді автоматты түрде тану контекстінде зерттелетінін ескереміз. Осы жұмыстарға негізделген бұл мақалада біз балалардың сөйлеуін автоматты түрде тану үшін қайталанатын нейрондық желіге негізделген тіл үлгісімен біріктірілген ұзақ қысқамерзімді жадыға негізделген акустикалық модельдеуді зерттейміз. Біздің эксперименттік нәтижелер осындай біріктірілген қайталанатын нейрондық желіге негізделген модельдеу балалардың сөйлеуді автоматты түрде тануының сәйкес және сәйкес келмейтін тапсырмаларында тиімді екенін көрсетеді.
БАЛАЛАРДЫҢ СӨЙЛЕУІН ТАНУ ҮШІН ҚАЙТАЛАНАТЫН НЕЙРОНДЫҚ ЖЕЛІЛЕР НЕГІЗІНДЕ АКУСТИКАЛЫҚ ЖӘНЕ ЛИНГВИСТИКАЛЫҚ МОДЕЛЬДЕУДІ ЗЕРТТЕУ
Жарияланған March 2022
163
125
Аңдатпа
Тіл
Қазақ
Дәйексөздерді қалай жазу керек
[1]
Мекебаев, Н., Түйебаев, Ш., Сабраев, Қ. і Еркебай, А. 2022. БАЛАЛАРДЫҢ СӨЙЛЕУІН ТАНУ ҮШІН ҚАЙТАЛАНАТЫН НЕЙРОНДЫҚ ЖЕЛІЛЕР НЕГІЗІНДЕ АКУСТИКАЛЫҚ ЖӘНЕ ЛИНГВИСТИКАЛЫҚ МОДЕЛЬДЕУДІ ЗЕРТТЕУ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 77, 1 (Бер 2022), 119–126. DOI:https://doi.org/10.51889/2022-1.1728-7901.16.