Сегодня синтез предложений используется в различных областях. Это голосовые помощники, системы IVR, умные дома, чат-боты и многое другое. Некоторое время назад в области синтеза речи, как и во многих других областях, появилось машинное обучение. Машинное обучение-это широкий набор искусственного интеллекта, который изучает методы создания алгоритмов, способных к обучению. Оказалось, что ряд компонентов всей системы можно заменить нейронными сетями, что позволяет не только приблизиться к существующим алгоритмам с качеством, но даже значительно превзойти их. В статье проведен обзор технологий синтеза предложений, решена проблема синтеза предложений на казахском языке на основе системы чат-ботов, с использованием метода seq2seq. На казахском языке собран параллельный корпус вопросов и ответов. Корпус вопросов и ответов на казахском языке был собран в результате перевода и очистки многих корпусов, таких как Cornell movie, Ubantu и других, которые используются для создания множества чат-ботов на английском языке. Проведен ряд экспериментов и получены результаты с использованием корпусов по построенной модели для синтеза предложений на казахском языке.
ИCCЛEДΟВAНИE И РAЗРAБΟТКA МEТΟДA CИНТEЗA ПРEДЛΟЖEНИЯ НA КAЗAХCКΟМ ЯЗЫКE НA ΟCНΟВE МAШИННΟГΟ ΟБУЧEНИЯ
Опубликован December 2021
80
26
Аннотация
Язык
Қазақ
Как цитировать
[1]
Рахимова, Д. и Aхмeт Г. 2021. ИCCЛEДΟВAНИE И РAЗРAБΟТКA МEТΟДA CИНТEЗA ПРEДЛΟЖEНИЯ НA КAЗAХCКΟМ ЯЗЫКE НA ΟCНΟВE МAШИННΟГΟ ΟБУЧEНИЯ. Вестник КазНПУ имени Абая. Серия: Физико-математические науки. 76, 4 (дек. 2021), 112–118. DOI:https://doi.org/10.51889/2021-4.1728-7901.15.