Перейти к основному контенту Перейти к главному меню навигации Перейти к нижнему колонтитулу сайта
Вестник КазНПУ имени Абая, Серия «Физико-математические науки»

РАСПОЗНАВАНИЕ ИМЕНОВАННЫХ СУЩНОСТЕЙ В НАУКЕ ПРИ ПОМОЩИ СОВРЕМЕННЫХ МЕТОДОВ

Опубликован 09-2021
Казахстанско-Британский технический университет
##plugins.generic.jatsParser.article.authorBio##
×

Амир Еленов

Институт информационных и вычислительных технологии -инженер-программист,

Казахстанско-Британский технический университет-магистрант 1 курса по специальности «наука о данных»

Казахский национальный университет им. аль-Фараби, Алматы, Казахстан
##plugins.generic.jatsParser.article.authorBio##
×

Асель Джаксылыкова

Институт информационных и вычислительных технологии-научный сотрудник, магистр технических наук, Казахский национальный университет им. аль-Фараби- докторант 3 курса по специальности «Информационные системы»

Аннотация

Данное исследование посвящено сравнительному изучению задачи распознавания именованных сущностей для текстов научных статей. Обработка естественного языка может рассматриваться как один из краеугольных камней в области машинного обучения, которая уделяет внимание проблемам, связанным с пониманием различных естественных языков и лингвистическим анализом. Уже было показано, что современные методы глубокого обучения обладают хорошей производительностью и точностью в таких областях, как распознавание изображений, распознавание образов, компьютерное зрение и так далее. Что может означать, что такая технология, вероятно, будет успешной и в области нейро-лингвистического программирования и приведет к резкое увеличение исследовательского интереса к этой теме. В течение очень долгого времени в этой области использовались довольно тривиальные алгоритмы, такие как поддержка векторных машин или различные типы регрессии, также использовалось базовое кодирование текстовых данных, что не давало высоких результатов.

Для обработки экспериментальных моделей использовался следующий набор данных: Набор данных ядро связи с научными объектами. Используемые алгоритмы: Долгая краткосрочная память, Классификатор случайного леса с условными случайными полями и распознавание именнованных сущностей с двунаправленным отображением энкодера из транмформеров.

В выводах оценки показателей всех моделей сравнивались друг с другом для сравнения. Данное исследование посвящено обработке научных статей, касающихся области машинного обучения, поскольку данная тема не исследована на достаточно должном уровне. Рассмотрение этой задачи может помочь машинам лучше понимать естественные языки, чтобы они могли лучше решать другие задачи нейро-лингвистического программирования, повышая оценки в здравом смысле.

pdf (Eng)