Перейти к основному контенту Перейти к главному меню навигации Перейти к нижнему колонтитулу сайта
Вестник КазНПУ имени Абая. Серия: Физико-математические науки

СИСТЕМАТИЧЕСКИЙ ОБЗОР СУЩЕСТВУЮЩИХ ИНСТРУМЕНТОВ ДЛЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ОБРАБОТКИ КАЗАХСКОГО ЯЗЫКА

Опубликован September 2024

160

32

Ә. Әйтім+
Международный Университет Информационных Технологий
https://orcid.org/0000-0003-2982-214X
Р. Сатыбалдиева+
Казахский Национальный исследовательский технический университет имени К.И.Сатпаев
https://orcid.org/0000-0003-2920-1490
Международный Университет Информационных Технологий
Казахский Национальный исследовательский технический университет имени К.И.Сатпаев
Аннотация

Разработка автоматизированных систем обработки для казахского языка в последние годы получила значительный импульс, что обусловлено растущей потребностью в инструментах обработки естественного языка, адаптированных для недостаточно представленных языков. Целью этого систематического обзора является критическая оценка существующих наблюдательных инструментов и методологий, используемых при создании и совершенствовании автоматизированных систем для казахского языка. С помощью всестороннего анализа академической литературы, технических отчетов и практических реализаций этот обзор определяет ключевые тенденции, проблемы и достижения в этой области. Обзор подчеркивает различные лингвистические сложности, уникальные для казахского языка, такие как его агглютинативная природа, гармония гласных и богатая морфологическая структура, которые представляют уникальные проблемы для разработчиков. Кроме того, исследование изучает эффективность текущих инструментов, включая токенизацию, разметку частей речи, синтаксический анализ и машинный перевод, при обработке казахского текста. Результаты показывают, что, несмотря на значительный прогресс, все еще существуют значительные пробелы в доступности и точности этих инструментов, особенно по сравнению с теми, которые доступны для более широко распространенных языков. Обзор завершается рекомендациями для будущих исследований и разработок, подчеркивая необходимость в более надежных наборах данных, улучшенных алгоритмах и совместных усилиях для дальнейшего продвижения области обработки казахского языка.

pdf (English)
Язык

English

Как цитировать

[1]
Әйтім A. и Сатыбалдиева R. 2024. СИСТЕМАТИЧЕСКИЙ ОБЗОР СУЩЕСТВУЮЩИХ ИНСТРУМЕНТОВ ДЛЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ОБРАБОТКИ КАЗАХСКОГО ЯЗЫКА. Вестник КазНПУ имени Абая. Серия: Физико-математические науки. 87, 3 (сен. 2024), 106–122. DOI:https://doi.org/10.51889/2959-5894.2024.87.3.009.