AN ON-DEVICE KAZAKH LANGUAGE AGENT FOR HUMAN–ROBOT INTERACTION

Қазақстандағы сервистік және көмекші роботтар командаларды мемлекеттік тіл – агглютинативті әрі ресурсы шектеулі қазақ тілінде түсінуі қажет, ал роботқа орнатуға болатын шағын тілдік модельдер қазақ тілімен нашар жұмыс істейді. Бұл жұмыста біз Qwen3-0.6B моделін үздіксіз алдын ала оқыту (continued pre-training) және бақылаумен нәзік баптау (supervised fine-tuning) арқылы алынған, 596 миллион параметрлі, қазақ тіліне бағытталған (қазақ/орыс/ағылшын) Farabi-0.6B моделін ұсынамыз және оны интеллектуалды адам–робот интерфейсінің құрылғы ішіндегі тілдік түсіну, ақпарат іздеу және әрекет таңдау өзегі ретінде зерттейміз. Зерттеу жұмысы үш негізгі ғылыми үлес ұсынады: біріншіден, интерфейс архитектурасын сипаттаймыз: қазақша бұйрық ниетке (intent) сәйкестендіріледі, содан кейін агент роботтың белгілі бір дағдысын (skill) іске қосу, жетіспейтін аргументті сұрау, бас тарту немесе растауды талап ету туралы шешім қабылдайды, сонымен қатар ақпараттық жауаптарды іздеп табылған нұсқаулыққа негіздейді. Екіншіден, тілдік ядроны арнайы әзірленген, имитациялық робот бұйрықтарының тестілік жиынтығында (бес шешім санаты бойынша 68 қазақ/орыс/ағылшын бұйрықтары) және стандартталған қазақша бенчмарктерде бағалаймыз. Модель әрекет еткен кезде бұйрықтарды робот дағдыларына 82% дағды таңдау және 79% слоттарды толтыру (slot-filling) дәлдігімен сәйкестендіреді; бұл ретте, агенттік нәзік баптау (agentic fine-tuning) бастапқы базалық деңгеймен салыстырғанда нақты нақтылау сұрақтарын қоюды (+20 пайыздық пункт) және құзыреттен тыс тапсырмалардан бас тартуды (+20 пайыздық пункт) айтарлықтай жақсартады; ал стандартталған қазақ тіліндегі тапсырмаларда ол өзімен қатарлас көлемдегі базалық модельден айтарлықтай асып түседі (мысалы, Belebele-kk: 34.0-ге қарсы 25.5; FLORES en→kk chrF: 37.4-ке қарсы 0.0). Үшіншіден, шеткі құрылғыларда жұмыс істеу мүмкіндігін сипаттаймыз: 0.6B моделі салмақтар (weights) үшін 0.30–1.19 GB жадты қажет етеді және орталық процессорда (CPU) секундына 21 токен жылдамдықты, ал кірістірілген мамандандырылған үдеткіштерде секундына 57–228 токен болжамды жылдамдықты қамтамасыз етеді, бұл нақты уақыттағы диалогтық режимнен айтарлықтай жоғары. Сондай-ақ, біз қауіпсіздікке тікелей әсер ететін екі осал тұсты ашық көрсетеміз: модель қайтымсыз әрекеттердің алдында растауды сұрамайды (100% бұзушылық) және ақпараттық сұраныстарды іздеу жүйесіне жеткіліксіз бағыттайды (10%), бұл тек модельдің өзіне сенбей, интерфейсте қауіпсіздікті сүзгілеудің айқын шектегіш қабатын (safety-gating layer) құру қажеттілігін негіздейді.

Кілтті сөздер

адам мен роботтың өзара әрекеттесуі қазақ тілі кіші тілдік модель ; шеткі жасанды интеллект (edge AI); ретривалмен толықтырылған генерация (RAG); құралдарды шақыру агенттік басқару ресурстары аз табиғи тілді өңдеу

Тіл

English

Як цитувати

[1]

Қадырбек N.K. , Мансурова M.E. , Мосави A. і Тойғанбаева N. 2026. АДАМ МЕН РОБОТТЫҢ ӨЗАРА ӘРЕКЕТТЕСУІНЕ АРНАЛҒАН ҚҰРЫЛҒЫ ІШІНДЕГІ ҚАЗАҚ ТІЛІ АГЕНТІ. Абай атындағы ҚазҰПУ Хабаршысы. Физика-математика ғылымдары сериясы. 94, 2 (Чер 2026). DOI:https://doi.org/10.51889/2959-5894.2026.94.2.017.

АДАМ МЕН РОБОТТЫҢ ӨЗАРА ӘРЕКЕТТЕСУІНЕ АРНАЛҒАН ҚҰРЫЛҒЫ ІШІНДЕГІ ҚАЗАҚ ТІЛІ АГЕНТІ

Завантажити посилання