Сегодня синтез предложений используется в различных областях. Это голосовые помощники, системы IVR, умные дома, чат-боты и многое другое. Некоторое время назад в области синтеза речи, как и во многих других областях, появилось машинное обучение. Машинное обучение-это широкий набор искусственного интеллекта, который изучает методы создания алгоритмов, способных к обучению. Оказалось, что ряд компонентов всей системы можно заменить нейронными сетями, что позволяет не только приблизиться к существующим алгоритмам с качеством, но даже значительно превзойти их. В статье проведен обзор технологий синтеза предложений, решена проблема синтеза предложений на казахском языке на основе системы чат-ботов, с использованием метода seq2seq. На казахском языке собран параллельный корпус вопросов и ответов. Корпус вопросов и ответов на казахском языке был собран в результате перевода и очистки многих корпусов, таких как Cornell movie, Ubantu и других, которые используются для создания множества чат-ботов на английском языке. Проведен ряд экспериментов и получены результаты с использованием корпусов по построенной модели для синтеза предложений на казахском языке.
ИCCЛEДΟВAНИE И РAЗРAБΟТКA МEТΟДA CИНТEЗA ПРEДЛΟЖEНИЯ НA КAЗAХCКΟМ ЯЗЫКE НA ΟCНΟВE МAШИННΟГΟ ΟБУЧEНИЯ
Опубликован December 2021
Аннотация
Язык
Қаз
Ключевые слова
кaзaхcкий язык
NMT
лингвиcтичecкиe рecурcы
мeтοд seq2seq
cинтeз прeдлοжeний
мaшиннοe οбучeниe
Как цитировать
[1]
Рахимова, Д. и Aхмeт Г. 2021. ИCCЛEДΟВAНИE И РAЗРAБΟТКA МEТΟДA CИНТEЗA ПРEДЛΟЖEНИЯ НA КAЗAХCКΟМ ЯЗЫКE НA ΟCНΟВE МAШИННΟГΟ ΟБУЧEНИЯ. Вестник КазНПУ имени Абая, Серия «Физико-математические науки». 76, 4 (дек. 2021), 112–118. DOI:https://doi.org/10.51889/2021-4.1728-7901.15.