Негізгі мазмұнға өту Негізгі шарлау мәзіріне өту Сайттың төменгі деректемесіне өту
Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы

БАЛАЛАРДЫҢ СӨЙЛЕУІН ТАНУ ҮШІН ҚАЙТАЛАНАТЫН НЕЙРОНДЫҚ ЖЕЛІЛЕР НЕГІЗІНДЕ АКУСТИКАЛЫҚ ЖӘНЕ ЛИНГВИСТИКАЛЫҚ МОДЕЛЬДЕУДІ ЗЕРТТЕУ

Жарияланған March 2022

163

125

Н.О. Мекебаев+
Қазақ ұлттық қыздар педагогикалық университеті
Ш.М. Түйебаев+
Әл-Фараби атындағы Қазақ ұлттық университеті, Алматы қ., Қазақстан
https://orcid.org/0000-0001-9769-1239
Қ.Ж. Сабраев+
Абай атындағы Қазақ ұлттық педагогикалық университеті,Алматы қ., Қазақстан
https://orcid.org/0000-0001-9141-4935
А.Қ. Еркебай+
Қазақ ұлттық қыздар педагогикалық университеті, Алматы қ., Қазақстан
https://orcid.org/0000-0002-5812-2137
Қазақ ұлттық қыздар педагогикалық университеті
Әл-Фараби атындағы Қазақ ұлттық университеті, Алматы қ., Қазақстан
Абай атындағы Қазақ ұлттық педагогикалық университеті,Алматы қ., Қазақстан
Қазақ ұлттық қыздар педагогикалық университеті, Алматы қ., Қазақстан
Аңдатпа

Кәдімгі сөзді автоматты түрде тану (ағыл. ASR - automatic speech recognition) жүйелері акустикалық модельдеу үшін GMM-HMM (ағыл. Gaussian Mixture Model- Hidden Markov model) және тілді модельдеу үшін n-gram қолданады. Соңғы онжылдықта терең бағытталған нейрондық желі (ағыл. Deep feed-forward neural network - DFNN) акустикалық модельдеуде GMM-ді (ағыл. Generalized Method of Moments), яғни математикалық статистика мен эконометрикада үлестірудің белгісіз параметрлерін және эконометрикалық модельдерді бағалау әдісін толық дерлік ауыстырды. Қазіргі автоматты түрде тану жүйелері негізінен DFNN-HMM акустикалық моделіне және n-gram тіл үлгісіне (ағыл. LM – language model) негізделген. Ұзақ қысқамерзімді контекстті модельдеу мүмкіндігінің арқасында қайталанатын нейрондық желіге (ағыл. RNN - recurrent neural network) негізделген тіл үлгілері n-gram тіл үлгілеріне қарағанда төмен түсініксіздікті береді деп хабарланған. Жақында қайталанатын нейрондық желінің нұсқасы, ұзақ қысқамерзімді жады (ағыл. LSTM - longshort term memory) акустикалық модельдеуде сәтті зерттелді. Бір қызығы, қайталанатын нейрондық желіге негізделген акустикалық және лингвистикалық модельдеуді қолданатын автоматты сөйлеуді тану жүйесін бағалау әлі хабарланбаған. Сонымен қатар, біз бұл жетістіктердің көпшілігі ересектердің сөйлеуді автоматты түрде тану контекстінде зерттелетінін ескереміз. Осы жұмыстарға негізделген бұл мақалада біз балалардың сөйлеуін автоматты түрде тану үшін қайталанатын нейрондық желіге негізделген тіл үлгісімен біріктірілген ұзақ қысқамерзімді жадыға негізделген акустикалық модельдеуді зерттейміз. Біздің эксперименттік нәтижелер осындай біріктірілген қайталанатын нейрондық желіге негізделген модельдеу балалардың сөйлеуді автоматты түрде тануының сәйкес және сәйкес келмейтін тапсырмаларында тиімді екенін көрсетеді.

.pdf (Русский)
Тіл

Қазақ

Дәйексөздерді қалай жазу керек

[1]
Мекебаев, Н., Түйебаев, Ш., Сабраев, Қ. і Еркебай, А. 2022. БАЛАЛАРДЫҢ СӨЙЛЕУІН ТАНУ ҮШІН ҚАЙТАЛАНАТЫН НЕЙРОНДЫҚ ЖЕЛІЛЕР НЕГІЗІНДЕ АКУСТИКАЛЫҚ ЖӘНЕ ЛИНГВИСТИКАЛЫҚ МОДЕЛЬДЕУДІ ЗЕРТТЕУ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 77, 1 (Бер 2022), 119–126. DOI:https://doi.org/10.51889/2022-1.1728-7901.16.