Данное исследование посвящено сравнительному изучению задачи распознавания именованных сущностей для текстов научных статей. Обработка естественного языка может рассматриваться как один из краеугольных камней в области машинного обучения, которая уделяет внимание проблемам, связанным с пониманием различных естественных языков и лингвистическим анализом. Уже было показано, что современные методы глубокого обучения обладают хорошей производительностью и точностью в таких областях, как распознавание изображений, распознавание образов, компьютерное зрение и так далее. Что может означать, что такая технология, вероятно, будет успешной и в области нейро-лингвистического программирования и приведет к резкое увеличение исследовательского интереса к этой теме. В течение очень долгого времени в этой области использовались довольно тривиальные алгоритмы, такие как поддержка векторных машин или различные типы регрессии, также использовалось базовое кодирование текстовых данных, что не давало высоких результатов.
Для обработки экспериментальных моделей использовался следующий набор данных: Набор данных ядро связи с научными объектами. Используемые алгоритмы: Долгая краткосрочная память, Классификатор случайного леса с условными случайными полями и распознавание именнованных сущностей с двунаправленным отображением энкодера из транмформеров.
В выводах оценки показателей всех моделей сравнивались друг с другом для сравнения. Данное исследование посвящено обработке научных статей, касающихся области машинного обучения, поскольку данная тема не исследована на достаточно должном уровне. Рассмотрение этой задачи может помочь машинам лучше понимать естественные языки, чтобы они могли лучше решать другие задачи нейро-лингвистического программирования, повышая оценки в здравом смысле.