Перейти к основному контенту Перейти к главному меню навигации Перейти к нижнему колонтитулу сайта
Вестник КазНПУ имени Абая. Серия: Физико-математические науки

БОРТОВОЙ КАЗАХОЯЗЫЧНЫЙ ЯЗЫКОВОЙ АГЕНТ ДЛЯ ВЗАИМОДЕЙСТВИЯ ЧЕЛОВЕКА И РОБОТА

Опубликован June 2026

0

Н.К. Кадырбек+
Казахский национальный университет имени аль-Фараби
https://orcid.org/0000-0002-5461-8899
М.Е. Мансурова +
Казахский национальный университет имени аль-Фараби
https://orcid.org/0000-0002-9680-2758
А. Мосави+
Обудский университет
https://orcid.org/0000-0003-4842-0613
Н.А. Тойганбаева+
Казахский национальный университет имени аль-Фараби
https://orcid.org/0000-0003-2661-8661
Казахский национальный университет имени аль-Фараби
Казахский национальный университет имени аль-Фараби
Обудский университет
Казахский национальный университет имени аль-Фараби
Аннотация

Сервисные и вспомогательные роботы в Казахстане должны понимать команды на казахском – агглютинативном, малоресурсном государственном языке, с которым малые встраиваемые языковые модели справляются плохо. В работе представлена Farabi-0.6B –казахоцентричная (казахский/русский/английский) модель на 596 млн параметров, полученная путём продолженного предобучения и контролируемой дообучающей настройки модели Qwen3-0.6B, и исследуется её применение в качестве бортового ядра интеллектуального интерфейса «человек–робот»: понимание языка, поиск информации и выбор действия. Описана архитектура интерфейса, в которой казахская команда отображается в намерение, а агент решает, вызвать ли навык робота, запросить недостающий аргумент, воздержаться или запросить подтверждение, обосновывая информационные ответы найденным руководством. На специально построенном эталоне из 68 команд по пяти категориям решений модель при выполнении действия выбирает правильный навык в 82% случаев и корректно заполняет аргументы в 79%; казахоориентированная агентная настройка повышает уточнение (+20 пп) и воздержание при запросах вне области (+20 пп) относительно доагентной базовой модели, а на стандартных казахских задачах модель значительно превосходит базовую модель того же размера (Belebele-kk 34.0 против 25.5; FLORES en→kk chrF 37.4 против 0.0). Анализ для периферийных устройств показывает объём весов 0,30–1,19 ГБ и 21 ток/с на ЦП с проекцией 57–228 ток/с на встраиваемых ускорителях — выше реального времени диалога. Также отмечены две связанные с безопасностью слабости: модель выполняет необратимые команды без подтверждения и редко направляет запросы к поиску, что обосновывает необходимость явного слоя контроля безопасности в интерфейсе, а не опоры на одну лишь модель.

Язык

English

Как цитировать

[1]
Кадырбек N.K. , Мансурова M.E. , Мосави A. и Тойганбаева N. 2026. БОРТОВОЙ КАЗАХОЯЗЫЧНЫЙ ЯЗЫКОВОЙ АГЕНТ ДЛЯ ВЗАИМОДЕЙСТВИЯ ЧЕЛОВЕКА И РОБОТА. Вестник КазНПУ имени Абая. Серия: Физико-математические науки. 94, 2 (июн. 2026). DOI:https://doi.org/10.51889/2959-5894.2026.94.2.017.