Әлеуметтік медиа-ресурстардағы ақпараттарға деген сенімнің артуына байланысты үндестікті талдау
саласына деген қызығушылық күн өткен сайын артуда. Өйткені үндестікті талдау миллиондаған әлеуметтік желі
қолданушыларының пікірлеріне мониторинг жүргізудегі басты технологиялардың бірі болып табылады.
Мақалада қазақ тіліндегі мәтіндер үндестігін талдауда LSTM желілерін қолдану қарастырылған. Нейрондық
желіні оқыту үшін ұялы телефондар пайдаланушыларының жалпы саны 1000 пікірі қолданылды. Зерттеу
жұмысы екі түрлі жолмен жүргізілді: бірінші жағдайда талданатын пікірлер алдын-ала өңдеуден (preprocessing)
өткізілді, екінші жағдайда алдын-ала өңдеу жүргізілген жоқ. Модель алдын-ала өңдеуден өткізілген жағдайдағы
сапаны бағалау өлшемінің орташа мәні 80%.-ке жетті. Бұл көрсеткіш алдын-ала өңдеу жүргізілмеген мәліметпен
оқытылған моделмен салыстырылғанда 11%-ға жоғары. Зерттеу нәтижелері мәтіндерді алдын-ала өңдеуден
өткізу модельдің сапасын жақсартады деген қортынды жасауға мүмкіндік берді.
ҚАЗАҚ ТІЛІНДЕГІ ҚҰЖАТТАР ҮНДЕСТІГІН ТАЛДАУДА LSTM ЖЕЛІЛЕРІН ҚОЛДАНУ
Жарияланған June 2021
166
23
Аңдатпа
Тіл
Қазақ
Дәйексөздерді қалай жазу керек
[1]
Кадырбек, Н., Мансурова, М. і Кыргызбаева, М. 2021. ҚАЗАҚ ТІЛІНДЕГІ ҚҰЖАТТАР ҮНДЕСТІГІН ТАЛДАУДА LSTM ЖЕЛІЛЕРІН ҚОЛДАНУ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 69, 1 (Чер 2021), 366–370.